Sunteți pe pagina 1din 123

UNIVERSIDAD NACIONAL DE

LOJA
2014

CARRERA DE INGENIERIA EN GEOLOGIA AMBIENTAL


Y ORDENAMIENTO TERRITORIAL

SEGUNDO CICLO

Ing. Diego Jara Delgado. Mg.Sc


DOCENTE-

010

ASIGNATURA

GEOESTADSTICA
SEGUNDO CICLO

NOCIONES BSICAS DE LA
GEOESTADISTICA

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

UNIVERSIDAD NACIONAL DE LOJA


REA DE LA ENERGA LAS INDUSTRIAS Y LOS
RECURSOS NATURALES NO RENOVABLES
UNIDAD ESTADSTICA
Ing. Diego Eduardo Jara Delgado
CAPITULO UNO ......................................................................................................... 4
NOCIONES BSICAS DE LA GEOESTADSTICA ............................................................. 4
1.1.

ESTUDIO DE LA GEOESTADSTICA ...........................................................................4

1.2.

LA ESTADSTICA EN EL CAMPO DE LAS CIENCIAS. .................................................. 11

1.3.

LA ESTADSTICA Y EL MTODO CIENTFICO ........................................................... 13

1.4.

QU PUEDE HACERSE CON LA ESTADSTICA? ...................................................... 14

1.5.

CONSIDERACIONES BSICAS. ............................................................................... 15

1.6.

NOTACIN DE SUMA Y REGLAS PARA SU USO. ..................................................... 16

PROPIEDADES DE LA OPERACIN SUMA......................................................................... 16


LA SUMATORIA Y SUS PROPIEDADES ................................................................................................. 17

1.7.

DEFINICIN DE ESTADSTICA ................................................................................ 19

1.8.

CLASIFICACIN DE ESTADSTICA........................................................................... 20

POBLACIN Y MUESTRA .................................................................................................................... 25

1.9.

MEDIDAS DE TENDENCIA CENTRAL. (MEDIA, MEDIANA, MODA) ........................... 27

MEDIA, MEDIA ARITMTICA O PROMEDIO x,

X , ........................................... 27

1.10. MEDIANA (Md).................................................................................................... 27


1.11. MODA O MODO (Mo). ......................................................................................... 29
EJERCICIOS DE APLICACIN: .............................................................................................................. 30
EJERCICIO 1 ........................................................................................................................................ 30
EJERCICIO 2 ....................................................................................................................................... 32
EJERCICIO 3 ....................................................................................................................................... 35
EJERCICIO 4 ........................................................................................................................................ 38

OTRAS MEDIDAS DE POSICIN. (MEDIA GEOMTRICA, ARMNICA, PONDERADA; Y,


CUANTILES) ................................................................................................................... 41

Media Geomtrica.(MG). ............................................................................ 41


Media Ponderada.()............................................................................... 43
EJERCICIOS DE APLICACIN: CUANTILES ............................................................................................ 47
EJERCICIO 1 ........................................................................................................................................ 47
EJERCICIO 2 ........................................................................................................................................ 53
EJERCICIO 3 ........................................................................................................................................ 53
EJERCICIO 4 ........................................................................................................................................ 54

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

MEDIDAS DE DISPERSIN. (DESVIACIN MEDIA ABSOLUTA, DESVIACIN MEDIA


CUADRADA, VARIANZA POBLACIONAL Y MUESTRAL, DESVIACIN ESTNDAR) .............. 55

Desviacin media absoluta. ...................................................................... 55

Desviacin media cuadrtica. ................................................................... 55

2
2
Varianza ; S . ........................................................................................ 56

Desviacin tpica......................................................................................... 57

Desviacin estndar ................................................................................... 58


EJERCICIO 1 ........................................................................................................................................ 60
EJERCICIO 2 ........................................................................................................................................ 63
EJERCICIO 1 ........................................................................................................................................ 73
EJERCICIO 2 ........................................................................................................................................ 74
EJERCICIO 3 ........................................................................................................................................ 74
EJERCICIO 1 ........................................................................................................................................ 76
EJERCICIO 2 ........................................................................................................................................ 78
EJERCICIO 3 ........................................................................................................................................ 80

2.

BIBLIOGRAFA. ............................................................................................. 122


Anlisis de varianza ........................................................................ Error! Marcador no definido.

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

CAPITULO UNO

NOCIONES BSICAS DE LA GEOESTADSTICA


1.1.

ESTUDIO DE LA GEOESTADSTICA

Introduccin.

En el presente acpite, se detalla el inicio de


principales teoras

la Geoestadstica, las

que componen esta ciencia, los

personajes que

desarrollaron estas teoras y cules fueron los diferentes campos en los


que empez a ser aplicada. As como, se presenta la definicin terica
de la Geoestadstica, se indican cules son los pasos principales que se
deben seguir para desarrollar un estudio Geoestadstico, y las teoras
principales en las cuales se ha desarrollado y se desarrolla esta ciencia.

Resea Histrica.

El uso de la Geoestadstica surge a partir de la dcada de los aos 50 con


los estudios realizados por D.G. Krige y por otros Ingenieros mineros en
las minas de oro de Rand, frica del Sur, desarrollaron un procedimiento
ponderado de estimacin, con determinados coeficientes correctores
empricos.

El desarrollo posterior es atribuido, en paralelo, a Matrn y Matheron,


quien estuvo

ligado directamente a la Escuela de Minas de Pars,

desarrollo la teora de las variables regionalizadas, que provee una


buena base para los recursos naturales, est teora incluye una tcnica de
estimacin ptima llamada Kriging, esta tcnica se hizo conocida debido a
que Matheron hizo las publicaciones en textos en Ingls y campos como
la Hidrogeologa empezaron a implementar la Geoestadstica.

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

En la ciencia del suelo, el reconocimiento de la variacin espacial de


propiedades del suelo, es probablemente tan viejo como su clasificacin.
Este enfoque de caracterizar la

variabilidad

de

los suelos es

principalmente cualitativo.

En los aos setenta, los investigadores empezaron los estudios de las


propiedades de suelo de una manera ms cuantitativa (p. ej. Rogowski,
1972; Nielsen et al, 1973; Biggar y Nielsen, 1976), la mayora de ellos
confi en mtodos estadsticos clsicos; as tenemos: la funcin de la
distribucin de frecuencias con momentos asociados y coeficientes de
variacin; anlisis de varianza para medir cambios sobre la distancia. Una
suposicin implcita en estos anlisis es; que las observaciones de una
variable del suelo son independientes con respecto a su ubicacin en el
campo.

Sin embargo, solamente el conocimiento de la distribucin de frecuencias


de las observaciones provee informacin sobre la variabilidad de las
observaciones con respecto a las coordenadas del rea donde se ha
hecho un muestreo.

La primera publicacin que aplic Geoestadstica apareci en 1978


(Campbell, 1978). En 1980, Webster y su colegas iniciaron una serie de
publicaciones llamadas Interpolacin Optima y mapeo isarithmico de
propiedades del suelo, en la que Kriging era por primera vez usado en la
ciencia

del

suelo

(Burguess

&

Webster,

1980,b;

Webster

&

Burguess,1980 Burguess et al, 1981; McBratney & Webster, 1983,


webster & Oliver, 1989). Samra en 1989 realiz estimacin de alturas en
plantaciones de Melia azedarach, Mandallaz (Mandallaz, 1993), que
compar varios mtodos de kriging en la estimacin de densidad y rea

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

basal. Hck (Hck et al, 1994), combin el uso de Sistemas de


Informacin Geogrficos con tcnicas geoestadsticas en la estimacin de
ndices de sitio de Pinus radiata en Nueva Zelandia.

En Chile, Corvaln (Corvaln et al, 1998) analizaron la aplicabilidad de


estas tcnicas en la estimacin de variables dasomtricas en bosques de
Pinus radiata, concluyendo que constituyen un aporte importante en la
planificacin del manejo forestal.

La palabra Geoestadstica, denota el estudio estadstico de fenmenos


naturales, tiene varias interpretaciones como la de Matheon, que la define
como: la aplicacin del formalismo de las funciones aleatorias al
reconocimiento y estimacin de fenmenos naturales (Journel &
Huijbregts, 1978). El trmino Geoestadstica nos indica, como algunos
interpretan incorrectamente, estadsticas en la geologa. Una ms
reciente (y orientado al SIG) interpretacin de Geoestadstica, podra ser:
las estadsticas involucradas con datos geogrficos, tambin llamada
estadsticas espaciales.

En este contexto cabe sealar la definicin que de forma pormenorizada


realiza Funes Nicols Hctor (2004) en su trabajo titulado Mtodos
Estadsticos en Problemas Espaciales, en que se parafrasea en los
siguientes trminos: El prefijo geo indica la relacin estrecha entre el
tema en estudio y todo lo perteneciente a la tierra, es decir en este caso la
estadstica relativa a la tierra y verdaderamente este fue el significado
original. Hart en 1954 le dio un contexto geogrfico para denotar las
tcnicas estadsticas que enfatizan la localizacin dentro de las
distribuciones zonales. Matheron uso el trmino en un contexto geolgico
para denotar la teora y los mtodos para inferir las reservas de mineral
en bruto desde datos espacialmente distribuidos en un bloque (volumen

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

de tierra y roca que puede ser minado si es suficientemente rico). En


Francia bajo el impulso de Matheron principalmente emergi antes de
1980, la disciplina Geoestadstica como una mezcla de Ingeniera en
Minas, geologa, matemtica y estadstica que a diferencia de otros
enfoque ms

clsicos tiene en cuanta la tendencia espacial y la

correlacin espacial que en terminologa minera corresponden a


variabilidad espacial en gran y pequea escala respectivamente. Las
mismas ideas tambin fueron desarrolladas en forma independiente por
Gandin en la Unin Sovitica, pero aplicadas a la meteorologa.
Sea {(s): s D}, una funcin aleatoria (proceso aleatorio), donde D es un
subconjunto fijo de Rd

llamado conjunto de ndices; y, s vara

continuamente en D. Matheron, padre de la Geoestadstica en su forma


actual la defini como la aplicacin del formalismo de las funciones
aleatorias al reconocimiento y estimacin de los fenmenos naturales

Cressie (1991) considera a la Geoestadstica como una rama de la


estadstica que abarca teoras y aplicaciones para procesos aleatorios
con ndices espaciales continuos. As en ambos casos, el trmino
Geoestadstica pierde su significado etimolgico.

La definicin dada por Cressie es ms general que Matheron porque deja


abierta la posibilidad de que el fenmeno en estudio sea proveniente de la
naturaleza o no, y as responder a nuevos problemas que surjan de la
tecnologa

Geoestadstica.

La Geoestadstica implica el anlisis y la estimacin de fenmenos


espaciales o temporales, tales como: calidades de metal, porosidades,
concentraciones de contaminantes.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

La palabra Geoestadstica es normalmente asociada con la Geologa,


desde que esta ciencia tiene sus orgenes en la minera. Hoy en da, la
Geoestadstica es un nombre asociado con una clase de tcnicas, para
analizar y predecir los valores de una variable que est distribuida en
espacio o tiempo. Se asumen tales valores implcitamente, para ser
puestos en correlacin entre s, y el estudio de semejante correlacin
normalmente se llama un "anlisis estructural" o un "Variograma".
Despus del anlisis estructural, se hacen estimaciones a las situaciones
de los sectores no muestreados usando la tcnica de interpolacin
"Kriging" .

La Geoestadstica, tiene como objetivo el caracterizar e interpretar el


comportamiento de los datos que estn distribuidos espacialmente
variables regionalizadas.

Dentro de los pasos principales de un estudio Geoestadstico tenemos:

Anlisis de los datos exploratorios.

Anlisis Estructural (Clculo y modelacin de los Variogramas).

Estimaciones (Kriging o simulaciones).

Fundamentos de la Geoestadstica

La necesidad de acudir a herramientas estadsticas para el anlisis de


datos en todas las reas del conocimiento, ha hecho que aparezcan con
el correr de los aos nuevas metodologas que, no obstante se centran en
fundamentos probabilsticos comunes, son especficas para cada una de
las diversas disciplinas del saber. Algunos ejemplos son, entre otros, la
econometra, psicometra o la bioestadstica. La gran relevancia que tiene

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

actualmente a nivel mundial el tema minero, geolgico como ambiental


ha hecho que los profesionales en estadstica encaminen esfuerzos en el
desarrollo de nuevas tcnicas apropiadas para el anlisis de informacin
enmarcada dentro de este contexto. Como consecuencia de este impulso
surgi una nueva rama de la estadstica, con lo cual surgen los mtodos
Geoestadsticos que juegan un papel preponderante.

El presente documento tiene un enfoque terico-prctico. Para el


seguimiento

completo

de

la

teora

descrita

se

requiere

tener

conocimientos bsicos de lgebra de matrices y de estadstica, y


matemtica. No obstante en el presente documento cubren diversos
temas como base para el abordaje de contenidos geoestadsticos y se
hace la respectiva aplicacin de mtodos que se evidencian en el acpite
final como parte de esta asignatura.

GEOESTADSTICA

SOPORTE DE
INFORMACIN

VARIOGRAMAS

Optimizacin
del muestreo

Patrones de
variabilidad
espacial

Krigeaje

GEOESTADSTICA

Simulacin
Condicional

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

10

Entre la diversidad de mtodos existentes de anlisis de datos espaciales


destacan los mtodos geoestadsticos, tanto por su carcter operativo
como por la calidad de sus resultados. As, entre otros aspectos de
inters, los mtodos de estimacin, krigeaje, o de simulacin condicional,
facilitan la creacin de cubiertas temticas (mapas temticos) a partir de
datos experimentales de distinta naturaleza (cualitativos y cuantitativos),
lo que resulta de una ayuda inestimable en el proceso de integracin de
datos a travs de un SIG. En este trabajo se presenta una sntesis de los
fundamentos de los mtodos geoestadsticos de estimacin y simulacin
y su aplicacin al anlisis de datos de inventario forestal. Particularmente,
se ha querido estudiar el problema de creacin de mapas temticos
mediante la aplicacin de dichos mtodos geoestadsticos que, aun
siendo todava poco utilizados, quiz debido a una infundada complejidad
terica, ofrecen excelentes posibilidades de aplicacin. Con ello
pretendemos facilitar al interesado en el estudio de los recursos forestales
la comprensin de los aspectos tericos fundamentales y de las reglas
prcticas necesarias para el desarrollo de una aplicacin geoestadstica.

La Geoestadstica es la aplicacin de la teora de variables


regionalizadas, es una herramienta muy usada ltimamente, pues en
sus inicios se aplicaba netamente a la estimacin de recursos mineros
y hoy en da abarca campos tan extensos que van desde la minera,
el petrleo, la hidrologa, estimaciones de bancos de peces,
contaminantes, asuntos forestales entre otros.

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

11

REAS DE APLICACIN
Hidrogeologa

Minera
Biodiversidad

Geoqumica

GEOESTADSTICA

FRM

Geofsica

SIG

Riesgos geolgicos

CO2

1.2.

Teledeteccin

LA ESTADSTICA EN EL CAMPO DE LAS CIENCIAS.

El estudio de la Estadstica se ha convertido en un paradigma dentro del campo


del conocimiento, cuya utilizacin actualmente se hace necesaria abordarla
desde los diferentes niveles educativos mediante las matemticas y desde los
diversos

campos del quehacer humano, o simplemente desde nuestra

actividad

cotidiana.

Dentro

del

mbito

de

las

ciencias

debemos

acostumbramos a manejar el pensamiento estadstico a fin de establecer


dimensiones diferentes a los hechos cotidianos. Al respecto (Ottaviani, 1998)
seala que el estudio de la Estadstica ayuda al desarrollo personal,
fomentando un razonamiento crtico, basado en la valoracin de la evidencia
objetiva; mediante la cual hemos de ser capaces de usar los datos cuantitativos
para controlar nuestros juicios e interpretar los de los dems; adems de lo
importante que resulta adquirir un sentido de los mtodos y razonamientos que

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

12

permitan transformar estos datos para resolver problemas de decisin y


efectuar predicciones.

Por lo expresado, la estadstica se ha convertido en un mtodo efectivo para


describir con exactitud los valores de datos econmicos, polticos, sociales,
psicolgicos, biolgicos qumicos o fsicos, y sirve como herramienta para
relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste
ya slo en reunir y tabular los datos, sino sobre todo en el proceso de anlisis e
interpretacin de esa informacin.

Sin embargo es importante sealar que desde su creacin la Estadstica se ha


enriquecido continuamente con los aportes de matemticos, filsofos y
especialistas en las diferentes ramas del saber humano, los han permitido
definirla como un mtodo cientfico para operar con los datos y de
interpretarlos. As en las ciencias sociales, administrativas, polticas, medicas,
en educacin y en otras ciencias ha permitido analizar algunos de los factores
casuales en sucesos complejos y que de alguna manera han sido analizadas
prolijamente por el investigador, mediante la utilizacin de los

mtodos

estadsticos compaeros constantes en la realizacin del proceso de


investigacin. La estadstica y su aplicacin, ha avanzado de tal forma en los
ltimos aos, se ha hecho imprescindible la utilizacin de la Estadstica de
manera descriptiva, como inductiva, en todas las investigaciones cientficas
sea cual fuere el carcter de las mismas.

Finalmente, al hablar de la etimologa de la palabra estadstica hemos afirmado


que no hay campo cientfico en el cual de cierto modo, se halle ausente la
estadstica, ya sea en el proceso de investigacin como nico mtodo capaz de
proporcionar resultados positivos. Sin embargo de ello, podemos citar unas
cuantas ciencias con las cuales la Estadstica guarda una vinculacin ms
estrecha.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

13

Se relaciona con la lgica por cuanto sta es la ciencia del raciocinio y la


Estadstica no hace otra cosa que analizar la expresin de los fenmenos
sujetos a una apreciacin numrica. Se relaciona con la Matemtica
(trigonometra, algebra, geometra), puesto que ellas son el vehculo que
permite obtener resultados concretos en la Estadstica.

En cuanto a la contabilidad basta con decir que las anotaciones contabilizadas


son valiosos datos estadsticos, los que hay que saber interpretar mediante el
proceso estadstico requerido para obtener conclusiones muy valiosas que de
otra manera pasaran inadvertidas.

Se relaciona con la Economa Poltica y las ciencias Econmicas en general.


Efectivamente si damos una mirada al campo econmico, all encontramos a la
Estadstica ofreciendo los datos sobre cuyos resultados se levantaran
conclusiones de innegable valor. Si queremos pensar en la Demografa,
encontramos que la Estadstica constituye el nico mtodo capaz de ser
utilizado dentro de esta Ciencia que aplica el procedimiento estadstico al
hombre considerado como ser vivo y en este caso se denomina tambin
Estadstica de la Poblacin o Biometra.

1.3.

LA ESTADSTICA Y EL MTODO CIENTFICO

La estadstica es una ciencia o mtodo cientfico que en la actualidad es


considerada como un poderoso auxiliar en las investigaciones cientficas, que
le permite a sta aprovechar el material cuantitativo. No existen ciencias cuyos
fenmenos no puedan ser tratados estadsticamente; por tal razn,

la

estadstica la denominan algunos investigadores como el lenguaje cientfico.,


por medio de la estadstica, se pueden realizar diagnsticos de cualquiera
investigacin que requiera una recoleccin de informacin. La estadstica nos
permite resumir los resultados de una investigacin en una forma significativa y
cmoda al igual que deducir conclusiones generales. De la misma forma nos

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

14

permite predecir qu suceder algo tomando en cuenta ciertas condiciones


que se han analizado sobre la base de los datos e informacin que
histricamente se tiene.

1.4.

QU PUEDE HACERSE CON LA ESTADSTICA?

Si partimos analizando que en la actualidad la estadstica ha alcanzado tal


grado de perfeccionamiento y especializacin; por ello, no existe disciplina
cientfica en la cual no se apliquen los mtodos estadsticos como herramienta
indispensable para iniciar cualquiera investigacin de envergadura.

En este aspecto, todo lo que se relacione con la recoleccin, procesamiento,


anlisis e interpretacin de datos numricos pertenece al dominio de la
estadstica, al respecto se tiene el clculo del aumento en promedio, de las
utilidades en una compaa de ventas de artculos por Internet los ltimos tres
aos; la recoleccin; la presentacin anual de una deuda a corto plazo de tres
compaas de electricidad; el porcentaje de su deuda a largo plazo; la
evaluacin de la eficacia entre diferentes programas de computacin, destinado
reducir el nmero de accidentes personales en una empresa, el tiempo perdido
en trabajo de alto riesgo; el anlisis de las variaciones que ocurren, las ventas
al menudeo, precios al consumidor y al mayoristas, y distribucin de dinero,
precios de productos comunes, productividad del sector agrcola, cuantificacin
de

reservas

minerales,

determinacin

de

concentraciones

promedio,

cuantificacin de riesgos; en el diseo, desarrollo y mejora de los procesos de


produccin (control de la variabilidad en el proceso, control de la calidad, el
estudio de materiales (duracin, dureza, elasticidad, factor de compresibilidad),
anlisis de rendimientos en procesos qumicos segn empleo de catalizadores,
anlisis de procesos hidrolgicos (clculo de avenidas, caudales generados por
cuencas

hidrogrficas,

deslizamientos,

muros

ciclpeos),

anlisis

de

dimensionamiento de estructuras y obras basados en el anlisis de riesgos; e

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

interpretacin de tablas, cuadros, resmenes

15

entre la multiplicidad de

actividades.

Todo lo expresado se resume en dos objetivos muy razonables e importantes


el primero que consiste en desarrollar

capacidades para la resolucin de

problemas, esto incluye el poder establecer que tcnica debo aplicar en


determinada situacin, as como poder utilizar realmente esa tcnica para dar
solucin a un problema y el segundo en obtener una idea ms clara de que
tipos de conocimientos estadsticos se puede utilizar y cules no son los
pertinentes en un fenmeno de la realidad.

1.5.

CONSIDERACIONES BSICAS.

La Estadstica como ciencia se divide en tres ramas principales a saber: La


Estadstica

Descriptiva

que

se

ocupa

de

la

descripcin

de

datos

experimentales, ms especficamente de la recopilacin, organizacin y


anlisis

de

datos sobre

alguna

caractersticas

de

ciertos individuos

pertenecientes a la poblacin o universo. Entre las etapas ms destacadas


tenemos: la recopilacin, presentacin, anlisis y uso de datos experimentales,
a partir de los cuales obtener conclusiones y tomar decisiones pertinentes, se
encarga de resumir (grfica y numricamente) la informacin contenida en un
conjunto de datos, destacando sus rasgos ms relevantes.

La teora de la probabilidad, instancia que proporciona una base racional para


resolver situaciones influidas por factores aleatorios La Probabilidad sirve de
puente entre ambas ramas, que constituye la base terica para poder hacer
inferencias en la poblacin a partir de lo observado y crear modelos para
problemas concretos; y, la teora de la inferencia, que incluye el anlisis e
interpretacin de muestras conocida como Inferencia Estadstica la que nos
permite obtener conclusiones y tomar decisiones en una poblacin (no

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

16

observable completamente) analizando solamente una parte representativa de


ella a la que llamamos muestra.
El objetivo bsico de la Estadstica es extraer la informacin contenida en un
conjunto de observaciones. Resumir los datos es un procedimiento til para
conseguirlo y puede hacerse mediante tablas, grficos o valores numricos. A
lo largo de este tema veremos las principales tcnicas numricas y grficas que
nos permiten describir una caracterstica de inters observada en una
poblacin, poniendo en relieve sus rasgos ms importantes.
1.6.

NOTACIN DE SUMA Y REGLAS PARA SU USO.

Para desarrollar la teora de los principios bsicos de estadstica y manejar sus


aplicaciones, frecuentemente se requiere una bagaje de conocimientos
matemticos: la mayor parte del estudio se apoya en la aritmtica bsica y en
el lgebra elemental en el caso de la Estadstica Descriptiva y en el caso de la
estadstica Inferencial, en aquellos casos

en los que se requieren algn

conocimiento especfico, lo explicaremos, si es el caso, antes de entrar a las


aplicaciones estadsticas por tratarse de modelos con fundamentacin propia
para estos casos.

PROPIEDADES DE LA OPERACIN SUMA

Dentro de la operacin suma, se establecen las principales propiedades, as


tenemos:
1.

Propiedad Clausurativa unvoca, de cerradura o candado.


, +

2.

Propiedad Asociativa.
, , ( + ) + = + ( + )

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

3.

Pgin
a

17

Propiedad Modulativa o de Existencia del Neutro.


; ( = ) ( + ) = + =
( + ) = + =

4.

Propiedad Simtrica o de Existencia del Inverso.


; ()

5.

+ () = () + = 0

Propiedad Conmutativa.
,

+ = +

LA SUMATORIA Y SUS PROPIEDADES


La sumatoria o sumatorio se emplea para representar la suma de muchos, de
algunos o de infinitos sumandos. Simblicamente se expresa:


=1

En donde, la expresin se lee: "sumatoria de Xi, donde i toma los valores


desde 1 hasta n". La operacin sumatoria se expresa con la letra griega
sigma mayscula , correspondiente a S. Consecuentemente i es el valor
inicial llamado lmite inferior, en tanto que n es el valor final llamado lmite
superior. Si la sumatoria abarca la totalidad de los valores, su expresin se
puede simplificar y su notacin ser:

=
=1

Es muy frecuente el uso del operador sumatoria en la Estadstica.


Algunas propiedades de la sumatoria.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

18

1. La sumatoria de una constante desde 1 a n es igual a n veces la


constante.

= + + + =
=1

2. La sumatoria del producto de una constante por una variable es igual a


la constante por la sumatoria de la variable.

= 1 + 2 + + = (1 + 2 + + )
=1

=
=1

=1

3. La sumatoria de los valores de una variable ms una constante es igual


a la sumatoria del variable ms n veces la constante.

( + ) = (1 + ) + (2 + ) + + ( + )
=1

= 1 + 2 + + + + +. . +

( + ) = +
=1

=1

4. La sumatoria de una constante, cuyo lmite inferior es diferente de 1 se


expresa:

= ( + 1)2 , =
=

Ejercicios

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

19

Dados los valores de 1 = 5; 2 = 3; 3 = 7; 4 = 0; 5 = 1; 6 = 3; 7 = 4


Efectuar las siguientes sumatorias:
5

a).

9
=1

b).

( + 8)
=1
7

c).

5
=1

d).

( + 1)
=1

e).

( 2)
=1

1.7.

DEFINICIN DE ESTADSTICA

Aunque en los puntos anteriores nos hemos referido en trminos generales a lo


que se entiende por Estadstica, es virtualmente imposible obtener un
consenso general en torno a su definicin, sin embargo es factible analizar tres
definiciones que encierran todo el contexto tanto desde su origen, como la de
un sustento para el estudio en la presente Unidad. La Estadstica como ciencia
surge:

Como vocablo derivado del latn status, que significa estado, posicin o

situacin; entendindose como la coleccin de los datos que caracterizan las


condiciones predominantes en el estado: por ejemplo, el nmero de
nacimientos y muertes, las cosechas, el comercio exterior a travs de las
importaciones y exportaciones. Por estadsticas oficiales entendemos los datos

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

20

publicados por las agencias del gobierno en forma de informacin o de


prospectos.

Como el conjunto de mtodos para planificar y realizar experimentos,


obtener datos y luego analizar, interpretar, y formular conclusiones basadas en
los datos obtenidos; y, es la ciencia encargada de recopilar, organizar, analizar
e interpretar informacin numrica o cualitativa, de manera que pueda llevar a
conclusiones vlidas.

Como cuerpo de conocimientos basados en una teora propia mediante


la especificacin de ciencia que estudia el conjunto de datos cualitativos con su
interpretacin en trminos matemticos, establecindose mtodos para la
obtencin de las medidas que lo describen, al igual que el anlisis de las
conclusiones, con especial referencia a la teora de las probabilidades,
consideradas tambin como ciencia de base matemtica para la toma de
decisiones en presencia de la incertidumbre y considerada como un suministro
de un conjunto de herramientas sumamente tiles en la investigacin.
Definiciones que refuerzan el concepto de que la estadstica como instrumento
que orienta a la recoleccin, organizacin y anlisis de datos numricos o de
observaciones con objetivos claros.

1.8.

CLASIFICACIN DE ESTADSTICA

La Estadstica al constituirse en la Ciencia de la sistematizacin, recoleccin,


ordenacin y

presentacin de los datos referentes a un fenmeno que

presenta variabilidad o incertidumbre para su estudio metdico, con objeto de


deducir las leyes que rigen esos fenmenos, y con ello poder de esa forma
hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones
Se conceptualiza sobre dos mbitos, esto es la estadstica descriptiva y la
inferencial as tenemos:

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

21

La Estadstica descriptiva (Deductiva). Se ocupa de la descripcin de


datos experimentales por lo cual se constituye en el conjunto de
procedimientos estadsticos que sirven para organizar

y resumir un

conglomerado de datos numricos; que incluye la presentacin de datos,


mediante el empleo de mtodos grficos, tabulares, cuadros, as como el
clculo de resmenes numricos tales como frecuencias, promedios,
medias, porcentajes y alcances. Es la rama utilizada comnmente, lo que
implica la abstraccin de varias propiedades dentro del conjunto de
observaciones y constituirse en una tcnica de investigacin que mediante
el empleo de mtodos grficos, tabulares o numricos nos ofrece una
informacin clara y fcil de comprender.

1. Recoleccin de datos.
2. Clasificacin de los datos.
3. Presentacin de los datos (texto, tablas, grficos).
4. Anlisis de los datos.
5. Interpretacin.

Es importante sealar que el campo de la estadstica descriptiva no tiene que


ver con las implicaciones o conclusiones que se puedan deducir de conjuntos
de datos (observaciones). La estadstica descriptiva sirve como mtodo para
organizar datos y poner de manifiesto sus caractersticas esenciales con el
propsito de llegar a conclusiones con ayuda de un sustento terico que define
su accionar mediante la ayuda de reglas y procedimientos para la presentacin
de los datos en una forma ms til y significativa, a partir de los datos
originales.
La estadstica Inferencial (Inductiva). Se constituye en el conjunto de
procedimientos estadsticos que sirven para deducir o inferir una realidad
acerca del conjunto de datos numricos (Poblacin), seleccionando un
grupo menor del conjunto

GEOESTADSTICA

(muestra). Es una rama ms compleja, que

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

22

implica el clculo de posibilidades para establecer provisiones y


conclusiones, aplicables en el futuro, basado en datos actuales, permitiendo
tomar decisiones razonables basadas en el anlisis.

1. Formulacin de hiptesis
2. Elaboracin de un plan investigativo
3. Recoleccin de datos
4. Anlisis de los datos
5. Aceptacin o rechazo de las hiptesis
6. Conclusiones.

Consecuentemente, la inferencia estadstica se basa en las conclusiones a la


que se llega por la ciencia experimental basndose en informacin incompleta
o de tipo particular (muestra) si se compara con toda la poblacin. En la
terminologa estadstica, el procedimiento inductivo implica el hacer inferencias
acerca de una poblacin adecuada universo a la luz de lo averiguado en un
subconjunto aparte o muestra.

La estadstica descriptiva por lo tanto requiere conocer algunas categoras que


en el contexto de su estudio, dentro de las cuales tenemos:
Poblacin o Universo est integrado por todas las puntuaciones o
unidades que se hacen sobre un conjunto de personas, animales, o cosas
las cuales poseen una caracterstica en comn especificada. Pero tambin
se define como poblacin al conjunto de valores de una de una magnitud
contable o medible cualquiera. Sin embargo estadsticamente se habla de
una poblacin de unidades y de una poblacin de observaciones.

Muestra de unidades es un nmero finito de unidades procedentes de una


poblacin de unidades.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

23

Poblacin de unidades es un grupo de entidades (personas, rboles,


bacterias, compuestos qumicos, etc.), que tienen alguna caracterstica
cuantificable en comn. Pueden ser finitas o infinitas en nmero. La
caracterstica cuantificable puede ser una variable continua o discreta.

Muestra de observaciones es un nmero finito de observaciones procedentes


de una poblacin de observaciones
Poblacin de observaciones es un grupo que consiste en los valores
numricos de una caracterstica cuantificable determinada en cada
elemento de una poblacin de unidades.

As una misma poblacin de unidades tendr en ocasiones ms de una


poblacin de observaciones asociada.
Muestra-Muestreo-Inferencia. Muestra es una parte de una poblacin que
aislamos para estudiarla o tambin es la coleccin de que forma parte de
una clase, concepto que resulta de importancia para el anlisis estadstico.
Por lo general uno dispone de una muestra de una poblacin para el estudio
que intenta realizar; y, al proceso de seleccin de la muestra se denomina
muestreo. El muestreo constituye el conjunto de operaciones que se
realizan para ordenar la distribucin de determinadas caractersticas en la
totalidad de la poblacin. La inferencia estadstica se refiere a una
conclusin con respecto a una poblacin de observaciones obtenidas sobre
una base de una muestra de observaciones. Se puede tambin

hacer

generalizaciones inducciones entendindose como aquel procedimiento


mediante el cual el investigador saca conclusiones acerca de la poblacin
basndose en el anlisis de una muestra a partir de esa poblacin.
Parmetro- Estadgrafo. Se define como parmetro a una caracterstica
descriptiva global de una poblacin de observaciones; en tanto que el

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

24

estadgrafo se lo especifica como una caracterstica descriptiva global de


una muestra de observaciones.
Frecuencia-Tipos de frecuencia. La frecuencia constituye dentro de la
estadstica uno de los primeros pasos dentro de la tabulacin de resultados
y se define como el nmero de veces que se repite un evento, valor o dato
estadstico dentro de una variable y se representa con la letra f. As
tenemos frecuencia absoluta, frecuencia relativa, porcentaje de frecuencia,
frecuencia absoluta acumulada, frecuencia relativa acumulada y porcentaje
de frecuencia acumulada.

Frecuencia absoluta dentro de una variable estadstica es el nmero de


veces que aparece dicha variable en un evento se representa por: f i

Frecuencia relativa constituye la relacin entre la frecuencia absoluta y el


nmero total de casos que aparecen en un evento, se representa por: ( p i ).
La frecuencia relativa de una variable siempre tendr un valor comprendido
entre 0 y 1. Se debe aclarar que la sumatoria de la frecuencia relativa de
una variable debe ser igual a la unidad.

Frecuencia acumulada absoluta

( Fi a ) y la Frecuencia acumulada

relativa ( Pi a ). Una frecuencia acumulada es la suma de las frecuencias de


una clase (serie) y de aquellas que la preceden (Mtodo clsico), pero
tambin existe otro modo de expresar las frecuencias acumuladas hacia la
mediana.
Medicin-Escalas

Es el procedimiento de asignacin de numerales a

objetos o acontecimientos cumpliendo normas preestablecidas. La medida


es la expresin numrica del proceso de medicin que resulta de comparar
dos magnitudes de la misma especie, considerando a una de ellas como
patrn o unidad. Las escalas de medicin pueden ser: escala nominal o

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

25

cardinal, escala ordinal o de rango, escala de intervalo; y, escala de


proporcin.
La escala nominal o cardinal se usa para clasificar objetos personas o
asignar una caracterstica con el fin de distinguir entre s los grupos a que
pertenecen varios objetos, expresando una identificacin para evitar escribir
su nombre dentro de la clasificacin.
La escala ordinal o de rango se usa cuando su significado especfico
depende de la naturaleza de la relacin que define la escala, pero las
operaciones aritmticas que puedan plantearse no tienen sentido alguno.
La escala de intervalo

est caracterizada por una unidad de medida

comn y constante que asigna un nmero real a todos los pares de objetos
en un conjunto ordenado.
La escala de proporcin

est caracterizada cuando en una escala se

cumple a ms de la escala de intervalo se tiene un punto cero real en su


origen y resulta ser independiente de la unidad de medida.

POBLACIN Y MUESTRA

El universo de objetos al cual se refiere el estudio que se pretende realizar


recibe el nombre de poblacin. Por ejemplo, todas las piezas terminadas en
una cadena de montaje, los nacidos en un da determinado, los coches de una
determinada marca, los alumnos de una institucin educativa. Las poblaciones
pueden ser finitas e infinitas (por ejemplo la poblacin de bacterias). En
general, estudiar todos los individuos de una poblacin (aun siendo finita) es
difcil, fundamentalmente por cuestiones de tiempo y costo. Se suele entonces
analizar nicamente una parte representativa de ella a la que llamamos
muestra.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

26

Atributos o Cualitativas (categricas): No toman valores numricos. Por


ejemplo, causa de fallo de un componente elctrico, tipo de defecto presente
en un material, partido al que se va a votar, asignacin de equivalencias de una
nota (Sobresaliente, Muy Buena, Buena, Malo, Deficiente).

Supongamos que se distinguen tres causas de fallo para los componentes en


estudio: A, B y C. Estas son entonces las modalidades de la variable causa de
fallo". Las modalidades han de ser exhaustivas e incompatibles. Eso significa
en este caso que en A, B y C estn recogidas todas las posibles causas de
fallo (exhaustivas), y cualquier componente ha de presentar slo una de esas
causas de fallo (incompatibles).

Cuantitativas (numricas): Toman valores numricos. Por ejemplo, tiempo de


fallo de un componente, grosor de una pieza, altura, peso, etc. Estas a su vez
se clasifican en:
Discretas: Toman un nmero finito o infinito numerable de valores (toman
valores enteros). Por ejemplo, nmero de piezas defectuosas en un lote,
nmero de hijos, nmero de alumnos de un colegio, nmero de personas que
habitan en una casa.
Continuas: Pueden tomar cualquier valor dentro de uno o varios intervalos de
la recta real (pueden tomar valores con decimales). Por ejemplo, altura,
temperatura, tiempo de fallo.

Finalmente, uno de los principales instrumentos empleados ampliamente en


estadstica es el uso de modelos los cuales constituyen versiones simplificadas
(abstracciones) de algunos problemas o situaciones de la vida real. Se utilizan
para destacar ciertos aspectos de estos, haciendo a un lado gran nmero de
detalles que pueden no tener mucha relacin con el problema. Por tanto, los

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

27

modelos pueden ayudar a reducir el grado de complejidad de lo que se est


trabajando.

1.9.

MEDIDAS DE TENDENCIA CENTRAL. (MEDIA, MEDIANA, MODA)

MEDIA, MEDIA ARITMTICA O PROMEDIO x,


Se obtiene a travs del cociente entre

X,

la sumatoria total del conjunto de

valores y el nmero total de casos.

Para Series

i 1

xi

N
n

Para Tabla de frecuencia

f x
i

i 1

f
i 1

Donde :
x media

f frecuencia

N f i total de casos
i 1

f i xi producto frecuencia var iable


1.10. MEDIANA (Md).

Es el punto de una distribucin que separa un mismo nmero de casos a cada


extremo de la serie o de la distribucin de frecuencias, constituyendo 50% a
partir del valor extremo superior o del extremo inferior

Para una serie. Se debe ordenar ascendente o descendente y se ubica el o los


elementos que ocupan la posicin central en la serie:

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL
...h, i, j , k , l , m, n
Md k

Pgin
a

28

...e, f , g , h, i, j...
gh
Md
2

Para una distribucin de frecuencias el valor de la mediana, puede ser obtenida


por dos procedimientos, el primero el mtodo grfico que consiste en la
interpolacin de la Ojiva de distribucin, trazando una lnea horizontal en el
punto 0,5 a partir de la abscisa y, hasta interceptar la ojiva y proyectar la
perpendicular hacia el eje de las ordenadas x. Para el caso de los datos
agrupados se determina su valor mediante la expresin:
N

2 f am
i
Md Li
f

Dnde:

Se debe considerar el valor de la frecuencia acumulada mayor e igual a 50%


(0,5). Que define la clase de la mediana.

Li = lmite inferior de clase donde se encuentra la frecuencia acumulada el


N
valor:
2
N
2 = suma de las frecuencias dividida entre dos partes iguales (N/2) que

define la clase ms baja para la cual la frecuencia acumulada excede al valor


encontrado.

f a = frecuencia acumulada anterior o menor a la frecuencia acumulada en

donde est la semisuma de frecuencias


f = frecuencia absoluta en donde se localiza la semisuma de frecuencias.

i = intervalo o razn.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

29

1.11. MODA O MODO (Mo).

Denominado tambin valor modal, valor cspide o valor de mxima


frecuencia, constituye el conjunto de los datos o dato que mayor nmero de
veces se repite, o que aparece con ms frecuencia. Pero es importante
considerar que en caso de una distribucin rectangular no existe moda.
Pero en caso de una distribucin en datos agrupados considerar con fines
prcticos utilizar el punto medio de la clase, o intervalo correspondiente a la
moda o clase modal, hay ocasiones en que esto no es suficiente y hay que
fijar un valor. En caso de datos agrupados la moda depende de la amplitud
de los intervalos de clase. Si los intervalos son muy pequeos la moda
puede desaparecer y cuando los intervalos de clase son distintos, es
necesario convertir los intervalos en funcin de frecuencias por unidad de
intervalo; esto es, hay que hallar las densidades de frecuencias, pudiendo
ser uni, bi o trimodal.
d1
Mo Li
i
d1 d 2

Se debe considerar el mayor valor de la frecuencia absoluta que ms veces se


repite y que define la clase modal.

Li = Lmite verdadero inferior de la clase modal (donde se encuentra la


frecuencia ms alta)

d 1 = el valor absoluto entre la frecuencia absoluta ms alta en relacin a la


frecuencia absoluta del intervalo anterior de la serie.

d 2 = el valor absoluto entre la diferencia de la frecuencia absoluta ms alta en


relacin a la frecuencia absoluta del intervalo mayor de la serie.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

30

EJERCICIOS DE APLICACIN:

EJERCICIO 1
Se estudia la ley de cobre en una mina y se recoge una muestra

de 30

porciones de roca y los valores expresados (en gr/Tn) se detallan a


continuacin. Determine el contenido promedio de cobre, la mediana y moda,
asumiendo un nmero de 8 clases.

54
63
58
60
57

55
55
56
55
70

75
56
77
66
60

67
71
58
69
64

60
57
70
59
60

65
80
58
62
65

Construccin de la tabla de distribucin de frecuencias.


Informacin preliminar:

amplitud a dato mayor Xs dato menor Xi


a 80 54 26
No de celdas Nc
i

amplitud ( a )
a
i
razn ( i )
Nc

26
3,25 razn
8

el valor del primer Intervalo :


0,4
0,2
2
54 0,2 53,8 53,8 3,3 57,1
3,3 3,25 0,05 8

DISTRIBUCIN DE FRECUENCIAS

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

31

Vi= marca de celda o valor medio


Fi= Frecuencia absoluta.

Fia = frecuencia absoluta acumulada

Pi= Frecuencia relativa.

Pia = frecuencia relativa acumulada

Intervalos

Vi

Fi

Pi

Frecuencia
Acumulada
Pia

Fia

ViFi

53,8-57,1

55,45

8/30=0,27

8/30=0,27

57,1-60,4

58,75

8/30=0,27

16

16/30=0,53 470,00

60,4-63,7

62,05

2/30=0,07

18

18/30=0,60 124,10

63,7-67,0

65,35

5/30=0,17

23

23/30=0,77 326,75

67,0-70,3

68,65

3/30=0,10

26

26/30=0,87 205,95

70,3-73,6

71,95

1/30=0,03

27

27/30=0,90

71,95

73,6-76,9

75,25

1/30=0,03

28

28/30=0,93

75,25

76,9-80,2

78,55

2/30=0,07

30

30/30=1,00 157,10

30

1.00

TOTAL

443,60

1874,70

Media Aritmtica:

Fi Vi = Sumatoria del producto entre la frecuencia y el valor medio de la


celda

F = Sumatoria de las frecuencias o nmero total de datos.


i

F Vi
i

i 1

1874,70
62,49
30

i 1

30

Mediana: = =15
2 2

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

32

La celda seleccionada que contiene el valor de la mediana es: 57,1- 60,4; por lo
tanto, el valor del lmite para la mediana = 57,1

fa
2
i
.Md Li
f

30

8
2
3,3 59,987
Md 57,10
8

El nmero que ocupa la posicin central ser: 59,987


Modo o moda:

Este valor se diferencia por la forma como se estructura la Distribucin de


frecuencias en algunos casos tiende a desaparecer. En este caso se tiene una
distribucin bimodal.
Li

Mo Li

L1 L2

d1
i
d1 d 2

53,8 60,4 57,10


2

Mo 57,10

80
80 82

3,3 58,99

El nmero que ms se repite ser: 58,99

EJERCICIO 2

Se tiene una variable cuantitativa discreta con los siguientes datos: Se ha


empleado una muestra de 50 trabajadores de una planta, indicando el nmero
de das que han sido beneficiados con la entrega de un ticket para proceder a
su pago correspondiente. Obtenga las magnitudes de tendencia central.

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

56
72
70
75
49
61
59
91

58
53
77
51
61
57
56

72
46
68
69
63
89
56

69
61
80
47
58
56
73

88
65
70
64
66
72
61

60
50
78
64
49
46
59

33

48
63
44
46
88
70
74

Construccin de la tabla de distribucin de frecuencias.


Informacin preliminar: Se recomienda no utilizar un nmero menor a 5
celdas o mayor a 20 celdas. En el presente ejercicio se debe de seleccionar el
nmero de clases considerando el nmero de datos disponibles, as se tiene 50
datos.
2k N
2 5 32 no se recomienda
2 6 64 se recomienda desde 6 celdas en adelante

Ni k 1
a
Ni 1
i
a
i
Ni 1

Dnde:
Ni = nmero de celdas o intervalos.
i = ancho de celda.
a =amplitud o recorrido de la variable

Otra forma para determinar los diferentes lmites de las celdas ser:
En el presente ejercicio se considera un nmero de 9 celdas
amplitud a dato mayor Xs dato menor Xi
a 91 44 47
amplitud (a)
a
No de celdas Nc
i
razn (i )
Nc
47
i
5,22 razn 5,3
9
el valor del primer Intervalo:
0,9
5,3 5,2 0,1 9
0,45
2
44 0,45 43,55 43,55 5,3 48,85

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

34

TABLA DE DISTRIBUCION DE FRECUENCIAS

Intervalos

Vi

Fi

Frecuencia
Acumulada

Pi

Pia

Fia

ViFi

43,55-48,85

46,20

6/50=0,12

6/50=0,12 277,20

48,85-54,15

51,50

5/50=0,10

11

11/50=0,22 257,50

54,15-59,45

56,80

9/50=0,18

20

20/50=0,40 511,20

59,45-64,75

62,10

9/50=0,18

29

29/50=0,58 558,90

64,75-70,05

67,40

8/50=0,16

37

37/50=0,74 539,20

70,05-75,35

72,70

6/50=0,12

43

43/50=0,86 436,20

75,35-80,65

78,00

3/50=0,06

46

46/50=0,92 234,00

80,65-85,95

83,30

0/50=0,00

46

46/50=0,92

85,95-91,25

88,60

4/50=0,08

50

50/50=1,00 354,40

50

1.00

TOTAL

0,00

3168,60

Media Aritmtica:

Fi Vi = Sumatoria del producto entre la frecuencia y el valor medio de la


celda

F = Sumatoria de las frecuencias o nmero total de datos.


i

F Vi

i 1

F
i 1

3168,60
63,372
50

Mediana:
N
50

25
2
2

Li

59,45 59,45 59,45


2

La celda seleccionada que contiene el valor de la mediana es: 59,45 64,75

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

fa
2
i
.Md Li
f

35

50

20
2
5,3 62,39
Md 59,45
9

Moda o modo:
Es el nmero que ms se repite se encuentra en dos celdas, por tanto el valor
promedio est comprendido entre 54,15 y 64,75 que define la clase muestral
para la moda cuya frecuencia se halla en el punto

Determinando el valor a travs de la expresin correspondiente se tiene:

Mo Li

d1
i
d1 d 2

Mo 62,10

95
95 98

5,3 59,45

EJERCICIO 3
A partir de la informacin de la Turbiedad

expresada en

NTU (Unidades

Nefelomtricas de Turbiedad), para agua destinada a Recreacin y Esttica, se


conoce que su

valor lmite corresponde a 50 NTU, observndose los

siguientes datos en torno a la Turbiedad de las aguas que ingresan diariamente


para su proceso previo de control Sobre esta base obtenga las magnitudes de
tendencia central.

56
72
70
75
49
61
59
91
70

58
53
77
51
61
57
56
48
74

GEOESTADSTICA

72
46
68
69
63
89
56
63

69
61
80
47
58
56
73
44

88
65
70
64
66
72
61
46

60
50
78
64
49
46
59
88

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

36

Elaboracin de la tabla de distribucin de frecuencias.


Informacin preliminar: Se recomienda no utilizar un nmero menor a 5
celdas o mayor a 20 celdas. En el presente ejercicio se debe de seleccionar el
nmero de clases considerando el nmero de datos disponibles, as se tiene 50
datos.
2k N
2 5 32 no se recomienda
2 6 64 se recomienda desde 6 celdas en adelante

Dnde:
Ni = nmero de celdas o intervalos.
i = ancho de celda.
a =amplitud o recorrido de la variable

Ni k 1
a
Ni 1
i
a
i
Ni 1

a 91 44 47
Ni k 1 Ni 6 1 7
i

a
47
47
i
i
7,8333
Ni 1
7 1
6

DISTRIBUCION DE FRECUENCIAS

Intervalos

Vi

Fi

Pi

Frecuencia
Acumulada
Pia

Fia

ViFi

44,00-51,84

47,92

10

10/50=0,20

10

10/50=0,20

479,20

51,84-59,68

55,76

10

10/50=0,20

20

20/50=0,40

557,60

59,68-67,52

63,60

11

11/50=0,22

31

31/50=0,62

699,60

67,52-75,36

71,44

12

12/50=0,24

43

43/50=0,86

857,28

75,36-83,20

79,28

3/50=0,06

46

46/50=0,92

237,84

83,20-91,04

87,12

4/50=0,08

50

50/50=1,00

348,48

TOTAL

GEOESTADSTICA

50

1.00

3180,00

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

37

Media Aritmtica:

Fi Vi = Sumatoria del producto entre la frecuencia y el valor medio de la


celda

F = Sumatoria de las frecuencias o nmero total de datos.


i

F Vi

i 1

3180
63,60
50

i 1

Mediana:

N
50

25
2
2

fa
2
i
.Md Li
f

Li

59,68 59,68 59,68


2

50

20
2
7,84 63,244
Md 59,68
11

Moda o Modo:

Es el nmero que ms se repite se encuentra en dos celdas, por tanto el valor


promedio est comprendido entre 44- 67,52 que define la clase muestral para
la moda cuya frecuencia se quiere determinar

Determinando el valor a travs de la expresin correspondiente se tiene:

Mo Li

d1
i
d1 d 2

GEOESTADSTICA

Mo

12 11
44 67,52

7,84 55,75 0.8711 56,6211


2
12 11 12 3

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

38

EJERCICIO 4
Los resultados del estudio de la ley de oro en una mina, luego del anlisis de
una muestra de 40 porciones de roca con concentraciones expresadas (en
gr/Tn), se obtienen los siguientes datos. A partir de la informacin
correspondiente: obtenga las medidas de tendencia central.

11,1
12,5
32,4
7,8
21
16,4
11,2

22,3
4,4
6,1
27,5
32,8
18,5
16,4

15,1
6,0
10,7
15,8
25,0
18,2
12,2

12,6
4,7
23,5
14,8
22,6
16
19,1

7,4
9,2
10,0
26,2
3,5
16,2

14,5
3,2
8,1
12,9
19,1
13,7

Elaboracin de la tabla de distribucin de frecuencias.


Informacin preliminar: Se recomienda no utilizar un nmero menor a 5
celdas o mayor a 20 celdas. En el presente ejercicio se debe de seleccionar el
nmero de clases considerando el nmero de datos disponibles, as se tiene 50
datos.

2k N
2 5 32 no se recomienda
2 6 64 se recomienda desde 6 celdas en adelante

Ni k 1
a
1
i
a
i
Ni 1
Ni

GEOESTADSTICA

Dnde:
Ni = nmero de celdas o intervalos.
i = ancho de celda.
a =amplitud o recorrido de la variable

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

39

amplitud a dato mayor Xs dato menor Xi


a 32.8 3.2 29.6
No de celdas Nc

amplitud (a)
a
i
razn (i )
( Ni 1)

29.6
4,933 razn 4,94
7 1
el valor del primer Intervalo :

0,06
0,03
2
3.2 0,03 3,17 3,17 4,94 8,11
4,94 4,93 0,01 6

DISTRIBUCION DE FRECUENCIAS

Intervalos

Vi

Fi

Frecuencia
Acumulada

Pi

Pia

Fia

ViFi

3,17-8,11

5,64

9/40=0,244

9/40=0,225

50,76

8,11-13,05

10,58

9/40=0,244

18

18/40=0,45

95,22

13,05-17,99

15,52

9/40=0,244

27

27/40=0,675

139,68

17,99-22,93

20,46

7/40=0,175

34

34/40=0,85

143,22

22,93-27,87

25,40

4/40=0,10

38

38/40=0,95

101,60

27,87-32,81

30,34

2/40=0,05

40

40/40=1,00

60,68

TOTAL

40

1.00

591,16

Media Aritmtica:

Fi Vi = Sumatoria del producto entre la frecuencia y el valor medio de la


celda

F = Sumatoria de las frecuencias o nmero total de datos.


i

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

40

F Vi

i 1

F
i 1

591,16
14,779
40

Mediana:

La celda seleccionada que contiene el valor de la mediana es: 13,05-17,99; por


lo tanto, el valor del lmite para la mediana = 57,1

N
40

20
2
2

fa
2
i
.Md Li
f

Li 13,05

40

18
2
4,94 14,15
Md 13,05
9

Moda o Modo:

Es el nmero que ms se repite se encuentra en dos celdas, por tanto el valor


promedio est comprendido entre 3,17-17,99; que define la clase muestral
para la moda cuya frecuencia se quiere determinar

Determinando el valor a travs de la expresin correspondiente se tiene:

Mo Li

d1
i
d1 d 2

GEOESTADSTICA

Mo

90
3,17 17,99

4,94 10,58 4,0418 14,62


2
90 97

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

OTRAS

MEDIDAS

DE

POSICIN.

(MEDIA

41

GEOMTRICA,

ARMNICA, PONDERADA; Y, CUANTILES)

Las medidas de posicin estudiadas con anterioridad, si bien son las ms


utilizadas, sin embargo no son las nicas. En este acpite analizaremos las
unidades no muy conocidas, pero que requieren ser analizadas especialmente
en determinados estudios; as tenemos: la media geomtrica y la media
armnica; as como un conjunto de posicin no centrales que son los cuartiles,
deciles y percentiles (centiles).
Media Geomtrica.(MG).

Se utiliza principalmente bajo ciertas circunstancias cuando se demuestra los


cambios porcentuales en una serie de nmeros positivos. Como tal tiene una
amplia aplicacin dentro del mbito de los negocios y en la economa, debido a
que con frecuencia se est interesado en establecerse el cambio porcentual en
las ventas, en el producto interno bruto o en cualquier serie econmica. Pero se
la utiliza con ms frecuencia para calcular la tasa de crecimiento porcentual
promedio de algunas series dadas a travs del tiempo. Se define mediante la
siguiente expresin:
MG = nX1 X2 . Xn
La raz ndice de n del producto de n trminos cuando se trata de una serie.

Cuando se trata de una serie con frecuencias la expresin ser:

f
f
f
f
MG = X11 X22 X33 Xnn

Finalmente cuando se trata de una tabla de Frecuencias acumuladas la


expresin ser:

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

42

f3
f1
f2
fn
MG = Xm1
Xm2
Xm3
Xmn

Media Armnica (MA).

Se utiliza principalmente bajo ciertas circunstancias cuando se demuestra los


cambios porcentuales en una serie de nmeros positivos; se define como el
recproco de la media aritmtica de los recprocos:

1
1 1
1
1
(1 + 2 + + )

Este valor se emplea para promediar variaciones con respecto al tiempo.

Observaciones sobre la media Geomtrica y la media Armnica

El empleo de la media geomtrica o de la armnica equivale a una


1

transformacin de la variable en log() (), respectivamente, y el clculo de


la media aritmtica de la nueva variable; As, si la variable abarca un campo de
variacin muy grande, tal como el porcentaje de impureza de un producto
qumico, por lo general alrededor del 0.1%, pero que en ocaciones llega incluso
al 1% o ms, puede ser ventajoso el empleo de () en lugar de () para
obtener una distribucin ms simtrica y que se aproxime ms a una
distribucin normal. La media aritmtica de () es el logaritmo de la media
geomtrica de (), de forma que la media empleada es equivalente al empleo
de la media geomtrica como valor medio de ().

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

43

Media Ponderada.( )

La media ponderada es una medida de tendencia central, se construye


asignndole a cada clase un peso, y obteniendo un promedio para los pesos.
Se utiliza cuando en un conjunto de datos cada uno de ellos tiene una
importancia relativa (o peso) respecto de los dems datos. Se obtiene
multiplicando cada uno de los datos por su ponderacin (peso) para luego
sumarlos, obteniendo as una suma ponderada; despus se divide sta entre la
suma de los pesos, dando como resultado la media ponderada.

1 1 + 2 2 + 3 3 + 4 4 + +
1 + 2 + 3 + 4 + +

=1
=1

CUANTILES: CUARTILES, DECILES PERCENTILES

Constituyen una generalizacin del concepto de mediana; al igual que la


mediana divide a la serie estudiada en dos partes con el mismo nmero de
elementos cada una de ellas, si la divisin se hace en cuatro partes, o en diez
partes, o en cien partes. Por lo cual se consideran como medidas de
localizacin. Se las denomina como CUANTILES (Q). Su funcin es informar
del valor de la variable que ocupar la posicin (en tanto por cien) que nos
interese respecto de todo el conjunto de variables.

Podemos decir; que los Cuantiles son medidas de posicin que dividen a la
distribucin en un cierto nmero de partes de manera que en cada una de ellas

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

44

hay el mismo de valores de la variable. Principalmente, se tiene tres clases de


cuantiles: cuartiles, deciles y percentiles.

CUARTILES

Se halla representado por tres valores con las siguientes caractersticas:

Q1: Primer cuartil, que es el valor de la variable por debajo del cual queda 1/4
(25%) de los elementos de la serie estudiada.

Q3: Tercer cuartil, que es el valor de la variable por debajo del cual quedan
los 3/4 (75%) de los elementos que constituyen la serie.

Evidentemente que el segundo cuartil Q2:(50% de los datos) coincide con la


mediana. Como puede comprobarse, no tendra utilidad alguna definir el cuarto
cuartil. El clculo de los cuartiles se realiza por el mismo procedimiento que el
clculo de la mediana, pues hay nicamente una diferencia cuantitativa entre
ambas medidas, pero tienen significados paralelos.

Q1; el primer cuartil se hallar aplicando la siguiente expresin matemtica:

4 f am
i
Q 1 Li
f

Dnde:
Se debe considerar el valor de la frecuencia acumulada mayor e igual a 25%
(0,25). Que define la clase del primer cuartil

Li = lmite inferior de clase donde se encuentra la frecuencia acumulada para el


N
cuartil cuyo es valor:
4

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

45

N
4 = suma de las frecuencias dividida una cuarta parte (N/4) que define la

clase ms baja para la cual la frecuencia acumulada excede al valor


encontrado.

f a = frecuencia acumulada anterior o menor a la frecuencia acumulada en

donde est la semisuma de frecuencias


f = frecuencia absoluta en donde se localiza la semisuma de frecuencias.

i = intervalo o razn.
Q3; el tercer cuartil se hallar aplicando la siguiente expresin matemtica:
3N

4 f am
i
Q 3 Li
f

Dnde:
Se debe considerar el valor de la frecuencia acumulada mayor e igual a 75%
(0,75). Que define la clase del tercer cuartil

Li = lmite inferior de clase donde se encuentra la frecuencia acumulada para el


3N
cuartil cuyo es valor:
4
3N
4 = suma de las frecuencias dividida en tres cuartas partes (3N/4) que

define la clase ms baja para la cual la frecuencia acumulada excede al valor


encontrado.

DECILES

Se constituyen en la segunda clase de cuantiles. Se obtienen los deciles


cuando se divide toda la serie o la distribucin en diez partes iguales. Se halla

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

46

representado por nueve valores o divisiones correspondientes del 10% al 90%;


con las siguientes caractersticas:

D1: Primer decil se considera el 10% de los valores de la serie por debajo de
N
l.
10

10 f am
i
D 1 Li
f

De acuerdo a la mediana y los cuartiles y como el primer decil las frmulas son
anlogas como ocurre con el resto de los deciles como en el caso D2, D3 al
D9. Por ejemplo el decil 7, deja el 70% de la masa o puntuacin de datos
investigados por debajo de l; y, su expresin ser:

D7: Sptimo decil se considera el 70% de los valores de la serie por debajo de
7N
l.

10

7N

10 f am
i
D 7 Li
f

PERCENTILES

Se constituyen en la tercera clase de cuantiles. Se obtienen los percentiles


cuando se divide toda la serie o la distribucin en cien partes iguales. Se halla
representado por noventa y nueve valores o divisiones correspondientes del
1% al 99%; con las siguientes caractersticas:

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

47

P1: Primer decil se considera el 1% de los valores de la serie por debajo de l.


N
100

100 f am
i
D 7 Li
f

P65: El percentil 65l se considera el 65% de los valores de la serie por debajo
65N
de l.

100

65 N

100 f am
i
D 7 Li
f

EJERCICIOS DE APLICACIN: CUANTILES


EJERCICIO 1
El anlisis de 49 muestras de aguas de la microcuenca, se realizan con el fin
de determinar los contenidos de Bario expresados en (mg/L) presentes en
aguas residuales cuyos valores son como sigue. Determine: cuartiles
(1 , 2 , 3 ) ; los deciles (1 , 2 , 3 , 9 ) y los percentiles (1 , 15 , 25 , 53 , 99 ),
respectivamente:

12,1
12,5
23,4
10,8
21,0
16,4
13,2

22,3
8,4
12,1
27,5
32,8
28,5
26,4

GEOESTADSTICA

25,1
16,0
15,7
13,9
23,5
23,9
32,2

32,6
14,7
22,5
14,8
20,6
19,9
19,1

17,4
9,2
16,0
21,2
13,5
19,2
25,8

14,5
23,2
18,1
13,9
23,1
18,7
27,9

12,8
8,9
9,1
11,1
18,8
14,4
7,8

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

48

Elaboracin de la tabla de distribucin de frecuencias.


2k N

2 k 49 se recomienda el valor mas cercano

2 6 64 k 6 celdas en adelante
log 2 (n) K k log 2 (49)

Ni k 1
a
1
i
a
i
Ni 1
Ni

Dnde:
Ni = nmero de celdas o intervalos.
i = ancho de celda.
a = amplitud o recorrido de la variable

amplitud a dato mayor Xs dato menor Xi


a 32.8 7.8 25
No de celdas Nc

amplitud (a)
a
i
razn (i )
( Ni 1)

25
5 razn 5
6 1
el valor del primer Intervalo :

7.8 7,8 5 12,8

DISTRIBUCION DE FRECUENCIAS

Intervalos

Vi

Fi

Frecuencia
Acumulada

Pi

Pia

Fia

ViFi

7,8-12,8

10,3

10

10/49=0,204

10

10/49=0,204

100,3

12,8-17,8

15,3

14

14/49=0,286

24

24/49=0,49

214,2

17,8-22,8

20,3

9/49=0,184

33

33/49=0,637

182,7

22,8-27,8

25,3

11

11/49=0,225

44

44/49=0,889

278,3

27,8 -32,8

30,3

5/49= 0,102

49

49/49=1

152,5

49

1.00

TOTAL

GEOESTADSTICA

928,0

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

49

Media Aritmtica:

Fi Vi = Sumatoria del producto entre la frecuencia y el valor medio de la


celda

F = Sumatoria de las frecuencias o nmero total de datos.


i

F Vi

i 1

F
i 1

928,0
18,94
49

Primer Cuartil:
El primer cuartil, corresponde a la celda seleccionada es: 12,80-17,8; por lo
tanto, el valor del lmite para la mediana = 12,8

N
49

12,25
4
4
N

fa
4
i
.Q1 Li
f

Li 12,8

49

10
4
5 13,61
Q1 12,8
14

Segundo Cuartil:
El segundo cuartil; o mediana, corresponde a la celda seleccionada es: 17,8022,8; por lo tanto, el valor del lmite para la mediana = 17,8

N
49

24,5
4
2
N

fa
2
i
.Q2 Li
f

GEOESTADSTICA

Li 17,8

49

24
2
5 18,08
Q2 17,8
9

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

50

Tercer Cuartil:
El valor del tercer cuartil; la celda seleccionada que contiene el valor es: 22,8027,8; por lo tanto, el valor del lmite para la mediana = 22,8

3N
3(49)

36,75
4
4
3N

fa

4
i
.Q3 Li
f

Li 22,8

3 * 49

33

4
5 24,5
Q3 22,8
11

Primer Decil:
El valor del primer decil; la celda seleccionada que contiene el valor es: 7,8012,8; por lo tanto, el valor del lmite para la mediana = 7,8

N
49

4,9
10
10
N

fa
10
i
.D1 Li
f

Li 7,8
49

0
10
5 10,25
D1 7,8
10

Segundo Decil:
El valor del segundo decil; la celda seleccionada que contiene el valor es:
7,80-12,8; por lo tanto, el valor del lmite para la mediana = 7,8

2N
2 * 49

9,8
10
10
2N

fa

10
i
.D2 Li
f

Li 7,8

98

0
10
5 12,7
D2 7,8
10

Tercer Decil:
El valor del tercer decil; la celda seleccionada que contiene el valor es: 12,8017,8; por lo tanto, el valor del lmite para la mediana = 12,8

3N
3 * 49

14,7
10
10

GEOESTADSTICA

Li 12,8

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

3N

fa

10
i
.D3 Li
f

Pgin
a

51

147

10

10
5 14,48
D3 12,8
14

Noveno Decil:
El valor del noveno decil; la celda seleccionada que contiene el valor es:
27,80-32,8; por lo tanto, el valor del lmite para la mediana = 27,8

9N
9 * 49

44,1
10
10
9N

fa

10
i
.D9 Li
f

Li 27,8

147

44

10
5 27,9
D9 27,8
5

Primer Percentil:
El valor del primer percentil; la celda seleccionada que contiene el valor es:
7,80-12,8; por lo tanto, el valor del lmite para la mediana = 7,8

N
49

0,49
100 100
N

fa

100
i
.P1 Li
f

Li 7,8

49

100
5 8,05
P1 7,8
10

Dcimo quinto Percentil:


El valor del dcimo quinto percentil; la celda seleccionada que contiene el valor
es: 7,80-12,8; por lo tanto, el valor del lmite para la mediana = 7,8

15 N
735

7,35
100
100
15 N

fa

100
i
P15 Li
f

GEOESTADSTICA

Li 7,8

735

100
5 11,475
P15 7,8
10

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

52

Vigsimo quinto Percentil:


El valor del vigsimo quinto percentil; la celda seleccionada que contiene el
valor es: 12,80-17,8; por lo tanto, el valor del lmite para la mediana = 12,8

25 N
1225

12,25
100
100

25 N

fa

100
i
P25 Li
f

Li 12,8

1225

10

100
5 13,604
P25 12,8
14

Quincuagsimo tercero Percentil:


El valor del quincuagsimo tercer percentil; la celda seleccionada que contiene
el valor es: 12,80-17,80; por lo tanto, el valor del lmite para la mediana
= 12,8

53N
2597

25,97
100
100
53N

fa

100
i
P53 Li
f

Li 12,8

2597

10

100
5 18,5
P53 12,8
14

Nonagsimo percentil
El valor del nonagsimo percentil; la celda seleccionada que contiene el valor
es: 27,80-32,80; por lo tanto, el valor del lmite para la mediana = 12,8

90 N
4410

44,1
100
100
90 N

fa

100
i
P90 Li
f

GEOESTADSTICA

Li 27,8

4851

44

100
5 28,3
P90 27,8
5

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

53

Nonagsimo noveno Percentil:


El valor del quincuagsimo tercer percentil; la celda seleccionada que contiene
el valor es: 27,80-32,80; por lo tanto, el valor del lmite para la mediana
= 12,8

99 N
4851

48,51
100
100
99 N

fa

100
i
P99 Li
f

Li 27,8

4851

44

100
5 32,31
P99 27,8
5

EJERCICIO 2
Se realiza la determinacin del peso (gramos) de seis muestras de una roca
obtenindose los siguientes valores: 320, 750, 720, 820, 940y, 997. Con estos
valores determinar la media geomtrica.

f
f
f
f
MG = X11 X22 X33 Xnn

MG = 320 750 720 820 940 997

MG = 1,328 1017
MG = 714,27

EJERCICIO 3
Supngase que una familia realiza un viaje en automvil a un ciudad y cubre
los primeros 100 km a 60 km/h, los siguientes 100 km a 70 km/h y los ltimos
100 km a 80 km/h. Calcular, en esas condiciones, la velocidad media realizada.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

54

1
1 1
1
1
(1 + 2 + + )

1
= 69,041
1 1
1
1
(
+
+
)
3 60 70 80

EJERCICIO 4
En un curso de Matemticas Superiores; se asignan pesos de importancia, de
la siguiente forma: Unida I (20% del curso), Unidad II (25% del curso), Unidad
III (20% del curso), Unidad IV (15% de la calificacin), Unidad V (20% de la
calificacin). Si las calificaciones de un alumno son 8 en la primera unidad, 5 en
la segunda, 8 en la tercera unidad, 10 en la cuarta unidad y 8 en la ltima
unidad. Es decir, se tienen la siguiente tabla:

Unidad
I
II
III
IV
V

Ponderacin (Wi)
20% = 0.2
25% = 0.35
20% = 0.2
15% = 0.15
20% = 0.10

Datos (Wi)
8
5
8
10
8

=1
=1

(8 0,2) + (5 0,35) + (8 0,2) + (10 0,15) + (8 0,1)


0,2 + 0,35 + 0,2 + 0,15 + 0.1
=

GEOESTADSTICA

7,25
= 7,25
1

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

55

MEDIDAS DE DISPERSIN. (DESVIACIN MEDIA ABSOLUTA,


DESVIACIN MEDIA CUADRADA, VARIANZA POBLACIONAL Y
MUESTRAL, DESVIACIN ESTNDAR)

Desviacin media absoluta.

Se utiliza para indicar la desviacin promedio se encuentra calculando la


desviacin de cada valor observado con respecto a la media; estas
desviaciones ( ) , se promedian sumando y dividiendo entre d. Aunque
esta medida parece prometedora, de hecho carece de valor. Las desviaciones
positivas siempre cancelan a las negativas y se obtiene un promedio de cero.
Este problema se signo puede evitarse si se ignoran

todos los signos

negativos y se toma el promedio de los valores absolutos de las desviaciones


y por tanto las expresiones se concretan en las expresiones que se sealan a
continuacin.
n

Dm

i 1

xi x
N

Dm

x
i 1

x fi
N

Para ello es necesario medir la dispersin de los datos, mediante la seleccin


de la media y despus se mide la variabilidad de los puntajes a partir del valor
medio y finalmente se halla el promedio de la variabilidad. Tanto para serie de
datos (no agrupados) como para una tabla de frecuencias (datos agrupados) la
desviacin media ser:
Desviacin media cuadrtica.

Aunque intuitivamente la desviacin media absoluta es una buena medida de la


extensin, no lo es desde el punto de vista matemtico Por lo tanto se recurre a
otro medio para evitar el problema del signo; a saber, elevar al cuadrado dicha
desviacin. Tanto para serie de datos (no agrupados) como para una tabla de
frecuencias (datos agrupados) la desviacin media cuadrada ser:

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Dmc

x
i 1

Dmc

x
i 1

Pgin
a

56

fi

2
2
Varianza ; S .

La varianza S 2 , 2 : se define como la media de las diferencias cuadrticas de


puntuaciones con respecto a su media aritmtica; puede ser aplicadas tanto
a la poblacin (todos datos) o para una muestra.

La varianza poblacional.

Para el caso de datos de una poblacin la expresin ser:

Datos no acumulados 2

f i xi x
i 1

x
n

i 1

La varianza muestral

Se puede definir como el "casi promedio" de los cuadrados de las desviaciones


de los datos con respecto a la media muestral. En muestras o series pequeas
se debe considerar el promedio en relacin con los grados de libertad (g.l.)
denominada varianza muestral.

Su frmula matemtica para el caso de datos referentes a una muestra es:

Datos acumulados S 2

GEOESTADSTICA

f
i 1

xi x

n 1

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

57

La razn para dividir entre ( 1) en lugar de entre es que slo hay ( 1)


desviaciones independientes ( ). Debido a que siempre su suma es cero,
el valor de cualquiera de ellas siempre es igual al negativo de la suma de las
dems ( 1) desviaciones.

Desviacin estndar

La desviacin estndar es una medida estadstica de la dispersin de un grupo


o poblacin. Una gran desviacin estndar indica que la poblacin est muy
dispersa respecto de la media; una desviacin estndar pequea indica que la
poblacin est muy compacta alrededor de la media.
Estadsticamente. La desviacin tpica o desviacin estndar es la medida
ms til de la variabilidad de los resultados de una muestra. La desviacin
tpica es una medida de la magnitud en que se desvan las diversas
puntuaciones obtenidas de su valor medio. Si las puntuaciones se agrupan
estrechamente en torno a la media, la desviacin ser relativamente pequea;
si se extienden en todas direcciones, Cabe sealar que estadsticamente se
tiene la desviacin tpica que ser relativamente grande y constituye la raz
cuadrada de la varianza de la poblacin; y, cuando su valor se relaciona con la
raz cuadrada de la varianza para una muestra constituye la desviacin
estndar.

Desviacin tpica.

Como se seala en las lneas anteriores, algunos autores definen la desviacin


tpica cuando la medida de la magnitud en que se desvan las diversas
puntuaciones obtenidas de su valor medio es obtenida para la poblacin; y,
sus expresiones tanto para datos agrupados como no agrupados ser:

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

i 1

f i xi x

x
i 1

58

x fi
2

Desviacin estndar
La desviacin estndar para una muestra se utiliza como estimador de la
desviacin estndar de una poblacin. Segn se observ antes la desviacin
estndar poblacional es la raz cuadrada

de la varianza poblacional. De

manera semejante la desviacin estndar muestral es la raz cuadrada de la


varianza muestral y se constituye en la medida de la magnitud en que se
desvan las diversas puntuaciones obtenidas de su valor medio para una
muestra y su expresin ser:
n

f
i 1

xi x

N 1

De manera generalizada para calcular la desviacin estndar o tpica; primero


calculamos el valor medio; a continuacin, hallamos las diferencias entre los
valores observados y el valor medio; despus, elevamos al cuadrado estas
diferencias y las sumamos; dividimos el resultado entre el nmero de
elementos de los que hemos obtenido una medida, y, finalmente, extraemos la
raz cuadrada. La desviacin estndar o tpica; por tanto es la raz cuadrada de
la varianza.

Otras frmulas para la Determinacin de la Desviacin Estndar

En poblacione s

x
n

i 1

GEOESTADSTICA

n
xi
n
i 1

2
xi

N
S i 1
N

n
xi
n
i 1

2
xi f i

N
S i 1
N

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

59

En muestras
n
xi
n
i 1

2
xi

n
i 1
N 1

x
f

i
i
n
i 1

2
xi f i

N
i 1
N 1

Coeficiente de Variacin:
En estadstica, cuando se desea hacer referencia a la relacin entre el tamao
de la media y la variabilidad de la variable, se utiliza el coeficiente de variacin.
Su frmula expresa la desviacin estndar como porcentaje de la media
aritmtica, mostrando una mejor interpretacin porcentual del grado de
variabilidad que la desviacin tpica o estndar. Por otro lado presenta
problemas ya que a diferencia de la desviacin tpica este coeficiente es
variable ante cambios de origen. Es importante que todos los valores sean
positivos y su media ser por tanto, un valor positivo. A mayor valor del
coeficiente de variacin mayor heterogeneidad de los valores de la variable; y a
menor coeficiente de variacin, mayor homogeneidad en los valores de la
variable.
Por lo cual, exige que:

; y, se determina mediante las expresiones:


CV

Sx
x

100

CV = |xx| 100

Dnde: x es la desviacin tpica; y,.


|x| es el valor de media aritmtica o promedio de la variable
Finalmente cabe destacar algunas propiedades que son de importancia dentro
del mbito estadstico:

El coeficiente de variacin no posee unidades.

El coeficiente de variacin es tpicamente menor que uno. Sin embargo,


en ciertas distribuciones de probabilidad puede ser 1 o mayor que 1.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

60

Para su mejor interpretacin se expresa como porcentaje.

Depende de la desviacin tpica, tambin llamada "desviacin


estndar", y en mayor medida de la media aritmtica, dado que cuando
sta es 0 o muy prxima a este valor el coeficiente de variacin, pierde
significado, ya que puede dar valores muy grandes, que no
necesariamente implican dispersin de datos.

Ejemplo de Aplicacin:

EJERCICIO 1
Para los resultados en el estudio de la ley de oro en una mina, se tiene que en
una muestra de 40 porciones de roca: los anlisis realizados para determinar
su concentracin (en gr/Tn), sus valores se sintetizan en el siguiente cuadro. A
partir de la informacin determine las medidas de dispersin estudiadas con
anterioridad.

11,1
12,5
32,4
7,8
21
16,4
11,2

22,3
4,4
6,1
27,5
32,8
18,5
16,4

15,1
6,0
10,7
15,8
25,0
18,2
12,2

12,6
4,7
23,5
14,8
22,6
16
19,1

7,4
9,2
10,0
26,2
3,5
16,2

14,5
3,2
8,1
12,9
19,1
13,7

Elaboracin de la tabla de distribucin de frecuencias.


Informacin preliminar:
2k N
2 5 32 no se recomienda
2 6 64 se recomienda desde 6 celdas en adelante

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

61

Dnde:
Ni = nmero de celdas o intervalos.
i = ancho de celda.
a =amplitud o recorrido de la variable

Ni k 1
a
Ni 1
i
a
i
Ni 1

amplitud a dato mayor Xs dato menor Xi


a 32.8 3.2 29.6
No de celdas Nc

amplitud (a)
a
i
razn (i )
( Ni 1)

29.6
4,933 razn 4,94
7 1
el valor del primer Intervalo :

0,06
0,03
2
3.2 0,03 3,17 3,17 4,94 8,11
4,94 4,93 0,01 6

Intervalos

xi

fi

xi f i

xi x

f i xi x

3,17 - 8,11

5,64

50,76

9,139

82,251

83,5213

751,69189

8,11 - 13,05

10,58

95,22

4,199

37,791

17,631601

158,6844

13,05 - 17,99

15,52

139,68

0,741

6,669

0,549081

4,941729

17,99 - 22,93

20,46

143,22

5,681

39,767

32,27376

225,9163

22,93 - 27,87

25,40

101,60

9,621

38,484

92,56364

370,2546

27,87 - 32,81

30,34

60,68

15,561

31,122

242,1447

484,2894

... =40

... =591,16

... =236,084

xi x

f i xi x

...
=1995,77832

a. Media Aritmtica:

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

62

F Vi

i 1

F
i 1

591,16
14,779
40

b. Desviacin media

Dm

x
i 1

x fi

Dm

236,084
5,9021
40

c. La Varianza:

En este caso se trata de una Distribucin de Frecuencias para Datos


Agrupados, la expresin a utilizar ser:
n

S x2

f
i 1

xi x

n 1

1995,77832
51,1738
40 1

d. Desviacin Estndar:

Sx

f
i 1

xi x

n 1

1995,77832
51,1738 7,1536
39

e. Coeficiente de Variacin:

CV

GEOESTADSTICA

Sx
x

100 CV

7,1536
100 48,4%
14,779

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

63

EJERCICIO 2
Para el estudio y tratamiento de inmersin para determinar el fosforo orgnico;
y , las diferentes especies de fsforo en aguas naturales (prueba de campo in
situ), se obtiene los resultados que se detallan a continuacin: Sobre la base
de la informacin detallada, determine las medidas de dispersin

54
43
44
45
38
38
39
40
42

34
33
37
35
34
37
36
35
34

33
34
37
28
29
30
31
32

32
28
29
30
31
23
24
27

23
24
25
26
18
19
18
19

19
13
14
15
16
17
9
10

Elaboracin de la tabla de distribucin de frecuencias.


Intervalos

xi

fi

xi f i

xi x

f i xi x

6,5-11,5

18

20,4

40,8

416,16

832,32

11,5-16,5

14

56

15,4

61,6

237,16

948,64

16,5-21,5

19

114

10,4

62,4

108,16

648,96

21,5-26,5

24

144

5,4

32,4

29,16

174,96

26,5-31,5

29

261

0,4

3,6

0,16

1,44

31,5-36,5

34

11

374

4,6

50,6

21,16

232,76

36,5-41,5

39

273

9,6

67,2

92,16

645,12

41,5-46,5

44

176

14,6

58,4

213,16

852,64

46,5-51,5

49

19,6

0,0

384,16

0,00

51,5-56,5

54

54

24,6

24,6

605,16

605,16

... =50 ... =1470

GEOESTADSTICA

... =401,6

xi x

f i xi x

... =4942

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

64

amplitud a dato mayor Xs dato menor Xi


a 54 9 45
No de celdas Nc

amplitud (a )
a
i
razn ( i )
Nc

45
4,5 razn 5
10
el valor del primer Intervalo :
i

5
2,5
2
9 2,5 6,5 6,5 5 11,5
5 4,5 0,5 10 5

a) Media aritmtica
n

i 1

xi

f
i 1

1470
29,4
50

b. Desviacin media

Dm

x
i 1

x fi

Dm

401,6
8,032
50

c) La Varianza:

En este caso se trata de una Distribucin de Frecuencias para Datos


Agrupados, la expresin a utilizar ser:

S x2

GEOESTADSTICA

f
i 1

xi x

n 1

4942
100,8571
49

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

65

d) Desviacin Estndar:
n

Sx

i 1

xi x

n 1

4942
100,8571 10,043
49

e) Coeficiente de Variacin:
CV

Sx
x

100 CV

10,043
100 34,16%
29,4

COVARIANZA, CORRELACIN Y REGRESIN

LA COVARIANZA
La covarianza estadsticamente es una medida de la variacin comn a dos
variables y, por tanto, una medida del grado y tipo de su relacin. Por lo cual
se constituye en una medida del grado en que dos variables aleatorias se
mueven en la misma direccin o en direcciones opuestas la una respecto a la
otra. En otras palabras, si dos variables aleatorias generalmente se mueven en
la misma direccin se dir que tienen una covarianza positiva. Si tienden a
moverse en direcciones opuestas, se dir que tienen una covarianza negativa.
La covarianza se mide como el valor que se espera de los productos de las
desviaciones de dos variables aleatorias respecto a sus correspondientes
medias. Una varianza es un caso especial de covarianza.

S xy

GEOESTADSTICA

1 n
x i x y i y

n 1 i 1

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

66

La expresin se resuelve promediando el producto de las puntuaciones


diferenciales por su tamao muestral (n pares de puntuaciones, ( 1) en su
forma insesgada).

Desviacin ( x )

Desvicin ( y )

x n 1

x n 1

S S
y n 1

y n 1

1 n
x i x

n 1 i 1

1 n
y i y

n 1 i 1

LA CORRELACIN Y REGRESIN
En las unidades de geometra, algebra, algebra lineal generalmente la relacin
entre las variables es de tipo determinista; esto es, dado un valor de una de las
variables, el valor de la otra variable se determina automticamente; y podra
afirmarse sin error. Entre tanto en estadstica estamos interesados en
relaciones entre variables aleatorias; y, por tanto una de las variables no queda
determinada por completo por otra de las variables, por lo cual se espera
determinar slo estimaciones.
Las relaciones estadsticas se obtienen mediante una primera fase de
exploraciones conocida como anlisis de correlacin, que consiste en analizar
los datos para conocer el grado de asociacin o correlacin entre dos o ms
variables de una poblacin. El grado de correlacin se expresa como un
nmero comprendido entre (-1 y +1) y se le conoce como coeficiente de
correlacin. Por ello como corresponde a un estudio exploratorio, el anlisis de
correlacin no es un fin en s mismo sino que su objetivo es establecer la
pertinencia de la segunda fase o anlisis de regresin; el mismo que nos facilita
establecer una funcin = () , que describe estadsticamente la asociacin o
relacin entre las variables de estudio; y, por lo tanto, su fin no es calcular sin
error sino obtener predicciones del valor de una variable, para un valor dado de
una variable.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

67

Debido a que los clculos para el coeficiente de correlacin y los parmetros


que definen la funcin se basan en una muestra aleatoria, se espera que
varen de una muestra a otra (tal como la media vara de una muestra a otra).
Esto plantea preguntas de significancia del coeficiente de correlacin, de los
parmetros de la funcin y de los valores de prediccin obtenidos con ella.
Tales preguntas son respondidas mediante intervalos de confianza y prueba de
hiptesis; esto es mediante el anlisis inferencial.

LA CORRELACIN

La correlacin constituye una tcnica estadstica nos indica si dos variables


estn relacionadas o no; por ello si el cambio en una variable est acompaado
de un cambio en la otra, entonces se dice que las variables estn
correlacionadas entre s. De all que los requerimientos de la estadstica van
ms all del comportamiento de una variable y en muchos de sus problemas
necesitamos investigar y definir la relacin entre dos o ms variables
Generalmente, la correlacin puede decir algo acerca de la relacin entre las
variables que de acuerdo a la informacin es positiva o negativa, por ello se
constituye en una herramienta poderosa que brinda informacin vital al
momento de tomar una decisin.
En el caso de que las variables en estudio, se observa que en ambos casos
suben o bajan juntos y en la misma direccin. Esto se denomina correlacin
positiva. Cuando entre las variables en estudio, se observa que el
comportamiento se produce en direccin opuesta, de modo que el aumento de
uno est acompaado de un descenso en el otro; defina lo que se conoce
como correlacin negativa.
Generalizando lo expresado, se puede afirmar que la correlacin estadstica es
medida travs del denominado coeficiente de correlacin (r); su valor numrico

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

68

vara de +1 a 1 Lo cual nos indica la fuerza de la relacin que existe entre las
variables. Cuando

> 0 indica una relacin positiva y < 0

expresa una

relacin negativa, mientras que = 0 indica que no hay relacin (o que las
variables son independientes y no estn relacionadas). Cuando el valor de
= 1 describe una correlacin positiva perfecta y

si el valor de = 1 ,

describe una correlacin negativa perfecta.


Cabe destacar que cuanto ms cerca estn los coeficientes de (+1; , 1)
mayor ser la fuerza de la relacin entre las variables.

Por ltimo; con el fin de emplear en forma prctica la magnitud de r como un


indicador del grado de correlacin o asociacin entre las variables, como norma
general, se define las siguientes directrices sobre la fuerza de la relacin que
son tiles (aunque muchos expertos podran disentir con la eleccin de los
lmites), como se puede observar en los valores que se detallan a continuacin.

Correlacin lineal entre dos variables


Valores de ""
()

Tipo y grado de correlacin

( < , )

Negativa fuerte

( , < < , )

Negativa moderada

( , < )

Negativa dbil

( )

No existe

( < . )

Positiva dbil

(. < < . )

Positiva moderada

(. < )

Positiva fuerte

(+)

Positiva perfecta

GEOESTADSTICA

Negativa perfecta

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Valor Coeficiente de Correlacin ""

Fuerza de relacin

( , ); , (+ + , )

Fuerte

(, , ); , (+, + , )

Moderada

(, , ); , (+, + , )

Dbil

(, + , )

Muy Dbil o Ninguna

Pgin
a

69

Desventajas en la utilizacin de la Correlacin


Si bien "" como coeficiente de correlacin es una herramienta poderosa, debe
ser utilizada con cuidado.

Los coeficientes de correlacin ms utilizados slo miden una relacin


lineal. Por lo tanto, es perfectamente posible que, si bien existe una
fuerte relacin no lineal entre las variables, "" est cerca de 0 (cero) o
igual a 0 (cero). En tal caso, un diagrama de dispersin puede indicar
aproximadamente la existencia o no de una relacin no lineal.

Hay que tener cuidado al interpretar el valor de "" , por ejemplo, se


podra calcular "" entre el nmero de calzado y la inteligencia de las
personas, la altura y los ingresos. Cualquiera sea el valor de "" , no
tiene sentido y por lo tanto es llamado correlacin de oportunidad o sin
sentido.

El coeficiente de correlacin "" no debe ser utilizado para decir algo


sobre la relacin entre causa y efecto. Dicho de otra manera, al
examinar el valor de "" podramos concluir que las variables ( ; )
estn relacionadas. Sin embargo, el mismo valor de "" no nos dice si
() influye a () o al revs. La correlacin estadstica no debe ser la

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

70

herramienta principal para estudiar la causalidad, por el problema con


las terceras variables.
Coeficiente de Correlacin de Pearson

El clculo de la r de Pearson a partir de los puntajes ayuda a relacionar el


tema de la correlacin con los puntajes estndar y la curva normal. Por ello
existen frmulas alternativas para su determinacin; as la expresin que
nos permite encontrar esta relacin ser:

xy

S xy
SxSy

(, ) (,)

1
=
[( )( )]
1
=1

Desviacin ( x)

S S

Desvicin ( y )

S S

x n 1

y n 1

x n 1

y n 1

1 n

x
i

n 1 i 1

1 n
y i y
n 1 i 1

Ejemplo de Aplicacin-Coeficiente de Correlacin de Pearson:

Se requiere determinar el coeficiente de correlacin presente en las muestras


analizadas en el campo de la minera respecto a los contenidos de oro x y
plata y, en las montaas (prueba de campo in situ); y, que se detallan a
continuacin:

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

xi x

yi y

20
16
14
12
8
18
15
12
10
5

10
12
12
10
7
16
14
9
8
2

7
3
1
-1
-5
5
2
-1
-3
-8

0
2
2
0
-3
6
4
-1
-2
-8

x y i y

0
6
2
0
15
30
8
1
6
64

x =130 y =100

49
9
1
1
25
25
4
1
9
64

... =132

71

0
4
4
0
9
36
16
1
4
64

... =188 ... =138

El valor promedio en cada una de las variables es:


x 13

xy

y 10

S xy
Sx Sy

Covarianza x , y S xy

n 10

S xy

1
132 14,67
10 1

Desviacin ( x )

Desvicin ( x)

n 10

n 10

Desvicin ( y )

GEOESTADSTICA

n 11

S 1 S
x
188 20,89
n 1 4,57

S x n 1

n 10

1 n n
2

1
x n 1
x n 1
n 1 ix1 i x 2
S x n 1 S x n 1
n

Desviacin ( x)
S x n 1

1 n
x i x y i y

n 1 i 1

S y n 1

i 1

x n 1

x n 1

i 1

10 1

1
188 20,89 4,57
10 1

S S
y n 1

y n 1

1 n

y
i

n 1 i 1

1
138 15,333 3,92
10 1

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

xy

S xy
SxSy

xy

14,67
0,82
4,57 3,92

Pgin
a

72

xy 0,82

ANLISIS DE CORRELACIN SIMPLE.


El anlisis de correlacin, constituye el conjunto de tcnicas estadsticas
empleado para medir la intensidad de la relacin (correlacin) entre dos
variables. El principal objetivo del anlisis de correlacin consiste en determinar
qu tan intensa es la relacin entre dos variables. Una medida de esta relacin
es el coeficiente de correlacin. Se puede tomar cualquier valor en una escala
de ( -1 a +1), inclusive. Primero se aplicaran estas medidas a datos en escala
de intervalo

y de razn. Sin embargo antes de hacerlo es necesario

representar los dos conjuntos de datos en un diagrama de dispersin.

DIAGRAMA DE DISPERSIN:

El diagrama de dispersin constituye la representacin grfica que se asume


como un tipo de diagrama matemtico que utiliza las coordenadas cartesianas
para mostrar los valores de dos variables en un conjunto de datos.
Los datos se muestran como un conjunto de puntos, cada uno con el valor de
una variable que determina la posicin en el eje horizontal y el valor de la otra
variable determinado por la posicin en el eje vertical. Por lo tanto un diagrama
de dispersin se llama tambin grfico de dispersin en el que se evidencia la
relacin entre las dos variables de inters.

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

73

EJERCICIO 1

Utilizando los datos obtenidos para una altitud de 926 metros, con valores
promedios mensuales y que se detallan en el cuadro de valores; se requiere
conocer y cuantificar la relacin entre las variables que participan en el
diagrama de dispersin (climograma). Con las variables que son caractersticas
para las determinaciones climticas dentro del anlisis correspondiente:
ALTITUD: 926 m.
MES
ENERO
FEBRERO
MARZO
ABRIL
MAYO
JUNIO
JULIO
AGOSTO
SEPTIEMBRE
OCTUBRE
NOVIEMBRE
DICIEMBRE

PROMEDIO MENSUAL
TEMPERATURA PRECIPITACIN
C
mmH2O
2,8
57
4
42
8
57
10
43
13
52
17
41
20
18
20
17
17
36
12
49
4
57
7
63

PRECIPITACIN [mm H2O]

70
60
50
40
30
20
10
0
0

10

15

20

25

TEMPERATURA [c]

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

74

EJERCICIO 2
Utilizando los datos para la altitud de 58 metros, que se detallan en el cuadro
de valores siguientes: Se desea cuantificar la relacin entre las variables que
participan en el diagrama de dispersin (climograma). Con el objetivo de definir
las variables que son caractersticas climticas para su anlisis:
ALTITUD: 58 m
MES
ENERO
FEBRERO
MARZO
ABRIL
MAYO
JUNIO
JULIO
AGOSTO
SEPTIEMBRE
OCTUBRE
NOVIEMBRE
DICIEMBRE

PROMEDIO MENSUAL
TEMPERATURA PRECIPITACIN
10,2
131
10,5
104
11,3
86
12,1
83
14,1
78
16,4
49
18,4
25
18,8
29
18,1
62
15,7
104
12,6
116
10,9
128

140

PRECIPITACIN [mm H2O]

120
100
80
60
40
20
0
0

10

15

20

TEMPERATURA [c]

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

75

EJERCICIO 3
Utilizando los datos de las puntuaciones de prueba y la produccin semanal de
artculos de artesana de seis vendedores en una empresa de produccin, se
tiene los valores definidos en el cuadro siguiente; sobre los cuales se desea
cuantificar la relacin entre las variables que participan en el diagrama de
dispersin:
CODIGO DEL VENDEDOR

PUNTUACIONES

VENTA DOLARES

A-1221-14

250

A-1221-15

325

A-1221-16

12

800

A-1221-17

700

A-1221-18

700

A-1221-19

600

A-1221-20

500

A-1221-21

10

600

900
800
VENTA EN DOLARES

700
600
500
400
300
200
100
0
0

10

12

14

PUNTUACIONES

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

76

COEFICIENTE DE CORRELACIN:

El modelo de anlisis de correlacin es una alternativa cuando se considera la


linealidad, y cuando no logra un coeficiente de correlacin apropiada, o cuando
el fenmeno en estudio tiene un comportamiento difcil de estimar. La forma
ms simple de tratar de establecer la tendencia es a travs de un diagrama de
dispersin o nube de puntos; y de acuerdo a ello establecer el modelo
adecuado al aplicarse sobre la base de los datos
El coeficiente de correlacin originado por el investigador Karl Pearson en el
ao 1900, describe la intensidad de la relacin entre dos conjuntos de variables
de nivel de intervalo o nivel de razn. Si bien se puede determinar a partir de
las desviaciones a travs de la covarianza, pero cuando se considera las
expresiones matemticas como:

( ) ( )
( 1)

( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]

EJERCICIO 1
Utilizando el anlisis de correlacin simple

determinar el coeficiente de

correlacin presente en las muestras analizadas en el campo de la minera


respecto a los contenidos de oro x y plata y, en las montaas (prueba de
campo in situ); sobre la base de la siguiente informacin:

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

77

Contenidos Oro y Plata


"x"
"y"
20
16
14
12
8
18
15
12
10
5

10
12
12
10
7
16
14
9
8
2

DIAGRAMA DE DISPERSIN
CONTENIDOS DE PLATA (g/Tn)

18
16
14
12
10
8
6
4
2
0
0

10

15

20

25

CONTENIDOS DE ORO (g/Tn)

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Nmero
de datos
"n"
1
2
3
4
5
6
7
8
9
10
TOTAL

Contenidos Oro y Plata


"x"
"y"
20
16
14
12
8
18
15
12
10
5
130

10
12
12
10
7
16
14
9
8
2
100

400
256
196
144
64
324
225
144
100
25
1878

78

X*y

100
144
144
100
49
256
196
81
64
4
1138

200
192
168
120
56
288
210
108
80
10
1432

( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]
10(1432) (130)(100)

[10(1878) (130)2 ] [10(1138) (100)2 ]


1320

[18780 16900] [11380 10000]

= 0,8192

EJERCICIO 2
Utilizando los datos obtenidos para una altitud de 926 metros, con valores
promedios mensuales y que se detallan en el cuadro de valores; se requiere
conocer y cuantificar la relacin entre las variables que participan en el
diagrama de dispersin (climograma). Con las variables que son caractersticas
para las determinaciones climticas dentro del anlisis correspondiente:

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

79

TEMPERATURA PRECIPITACIN

"x"
2,8
4
8
10
13
17
20
20
17
12
4
7

"y"
57
42
57
43
52
41
18
17
36
49
57
63

70

PRECIPITACIN [mm H2O]

60
50
40
30
20
10
0
0

10

15

20

25

TEMPERATURA [c]

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

TEMPERATURA PRECIPITACIN

Nmero
de datos
"n"
1
2
3
4
5
6
7
8
9
10
11
12
TOTAL

"x"

X*y

3249
1764
3249
1849
2704
1681
324
289
1296
2401
3249
3969
26024

159,6
168
456
430
676
697
360
340
612
588
228
441
5155,6

"y"

2,8
4
8
10
13
17
20
20
17
12
4
7
134,8

80

57
42
57
43
52
41
18
17
36
49
57
63
532

7,84
16
64
100
169
289
400
400
289
144
16
49
1943,84

( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]
12(5155,6) (134,8)(532)

[12(1943,84) (134,8)2 ] [12(26024) (532)2 ]


9846,4

[23326,08 18171,04] [312288 283024]

= 0,8017

EJERCICIO 3
Utilizando los datos para la altitud de 58 metros, que se detallan en el cuadro
de valores siguientes: Se desea cuantificar la relacin entre las variables que
participan en el diagrama de dispersin (climograma). Con el objetivo de definir
las variables que son caractersticas climticas para su anlisis:
a. Diagrama de dispersin de los datos

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

81

140

PRECIPITACIN [mm H2O]

120
100
80
60
40
20
0
0

10

15

20

TEMPERATURA [c]

b.

Elaboracin del cuadro de valores para el modelo de ajuste


Nmero
de datos
"n"

1
2
3
4
5
6
7
8
9
10
11
12
TOTAL

Temperatura
Precipitacin

"x"
10,2
10,5
11,3
12,1
14,1
16,4
18,4
18,8
18,1
15,7
12,6
10,9
169,1

X
"y"
131
104
86
83
78
49
25
29
62
104
116
128
995

104,04
110,25
127,69
146,41
198,81
268,96
338,56
353,44
327,61
246,49
158,76
118,81
2499,83

X*y

17161
10816
7396
6889
6084
2401
625
841
3844
10816
13456
16384
96713

1336,2
1092
971,8
1004,3
1099,8
803,6
460
545,2
1122,2
1632,8
1461,6
1395,2
12924,7

c. Determinacin del coeficiente de correlacin

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

82

( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]
12(12924,7) (169,1)(995)

[12(2499,83) (169,1)2 ] [12(96713) (995)2 ]


13158,10

[29997,96 28594,81] [1160556 990025]

= 0,8506

REGRESIN
En estadstica, el anlisis de regresin es un proceso estadstico para la
estimacin de relaciones entre variables, lo que permite obtener una nueva
relacin pero de un tipo especial denominado funcin, en la cual la variable
independiente se asocia con un indicador de tendencia central de la variable
dependiente. Incluye muchas tcnicas para el modelado y anlisis de diversas
variables, cuando la atencin se centra en la relacin entre una variable
dependiente y una o ms variables independientes. Ms especficamente, el
anlisis de regresin ayuda a entender cmo el valor tpico de la variable
dependiente cambia cuando cualquiera de las variables independientes es
variada, mientras que se mantienen las otras variables independientes fijas.
Ms comnmente, el anlisis de regresin estima la esperanza condicional de
la variable dependiente dadas las variables independientes - es decir, el valor
promedio de la variable dependiente cuando se fijan las variables
independientes. Con menor frecuencia, la atencin se centra en un cuantil u
otro parmetro de localizacin de la distribucin condicional de la variable
dependiente dadas las variables independientes. En todos los casos, el objetivo
es la estimacin de una funcin de las variables independientes llamada la

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

83

funcin de regresin. En el anlisis de regresin, tambin es de inters para


caracterizar la variacin de la variable dependiente en torno a la funcin de
regresin que puede ser descrito por una distribucin de probabilidad.
El anlisis de regresin es ampliamente utilizado para la prediccin y previsin,
donde su uso tiene superposicin sustancial en el campo de aprendizaje
automtico. El anlisis de regresin se utiliza tambin para comprender que
cuales de las variables independientes estn relacionadas con la variable
dependiente, y explorar las formas de estas relaciones. En circunstancias
limitadas, el anlisis de regresin puede utilizarse para inferir relaciones
causales entre las variables independientes y dependientes. Sin embargo, esto
puede llevar a ilusiones o falsas relaciones, por lo que se recomienda
precaucin; por ejemplo, la correlacin no implica causalidad. Cabe sealar
que en estadstica la palabra predecir no se utiliza en el sentido empleado por
los astrlogos o mentalistas sino ms bien en un sentido lgico como es el de
utilizar el conocimiento del comportamiento de una variable para obtener
informacin sobre la otra variable.

MODELOS DE REGRESIN LINEALES Y NO LINEALES


Con frecuencia, el tratamiento de regresin se limita al caso de regresin lineal;
que en muchos veces puede ser suficiente, pero en otros no lo es, por lo cual
ser necesario probar la linealidad de la curva de regresin a ms del lineal
podr ser cuadrtico, potencial, exponencial y logartmica; sumado a ello,
tambin la opcin del mtodo del anlisis de la varianza. De este grupo de
alternativas, se puede seleccionar el modelo adecuado que describa los datos
en problemas de ingeniera; as como la posibilidad de que nos proporcione los
elementos de juicio suficientes para la toma de decisiones en condiciones de
incertidumbre.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

84

REGRESIN LINEAL O PREDICCIN DE Y A PARTIR DE X

Es el proceso por el cul encontramos la ecuacin de la recta que mejor se


ajuste para un conjunto o serie de datos. Como resultado, obtenemos una
ecuacin de la forma: = + .

Donde 0.

( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]

Es importante sealar que por regla general cuando las predicciones se


vuelven ms exactas o medida que aumenta el tamao de una correlacin.
Para las correlaciones que son menos que perfectas, podemos construir an
una prediccin o lnea de regresin que se ajuste mejor a la direccin de los
puntos en un diagrama de dispersin; e incluso aunque todos los puntos nunca
estn sobre esa lnea de ajuste y nuestras predicciones sean menos que
exactas.

RECTA DE AJUSTE LINEAL: MTODO DE LOS MNIMOS CUADRADOS

Estadsticamente a travs de este mtodo se pretende desarrollar las


habilidades para la utilizacin de uno de los mtodos lineales y su estimacin a
mediante los mnimos cuadrados. Para lograr este

objetivo, se realiza la

descripcin bibliogrfica sobre la base de los conceptos y mediante ejemplos


que sirven al momento de aplicacin de los mtodos lineales y estimacin por
mnimos cuadrados, adems de su inferencia, prediccin y correlacin.

Las expresiones matemticas (sistema de ecuaciones) consideradas como


normales para el ajuste correspondiente tenemos:

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

85

= +
= +

( ) ( )( )
( 2 ) ( )2

( )
( )

En donde la ecuacin de regresin que se utiliza para valores brutos (sin


ninguna transformacin) se expresa de la siguiente forma:
= + .

Donde 0.

Recordemos que:
, =
=
=

APLICACIN DEL AJUSTE LINEAL


La relacin entre el nivel de excavacin expresado en metros; y, la
determinacin del pH en los diferentes niveles extraccin del material; ha
facilitado la informacin cuantitativa que se detalla en el cuadro siguiente,
mediante los valores definidos cuantitativos; se requiere establecer el modelo
de ajuste que estadsticamente permita una mejor inferencia y estimacin entre
los parmetros establecidos; as como el anlisis de la dispersin de los datos
correspondientes:

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

"x" [m]
-3
-2
-1
0
1
2
3

d.

86

"y" [pH]
7.5
3
0.5
1
3
6
14

Elaboracin del cuadro de valores para el modelo de ajuste


"n"

"x"

"y"

x*y

-3

7.5

56.25

-22.5

-2

-6

-1

0.5

0.25

-0.5

36

12

14

196

42

35

28

307.5

28

TOTAL

e. Diagrama de dispersin de los datos


16
14
12
10
8
6
4
2
0
-4

-3

GEOESTADSTICA

-2

-1

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

87

f. Determinacin del coeficiente de correlacin

( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]

7(28) (0)(35)
[7(28) (0)2 ] [7(307,5) (35)2 ]
196

[196 0] [2152,5 1225]

= 0,4597

:
:
= +
= +
= +

GEOESTADSTICA

( ) ( )( )
( 2 ) ( )2

7(28) (0)(35)
=1
7(28) (0)2

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

88

( )
( )

35
7

Pgin
a

0
7

=5

Ecuacin lineal de ajuste ser:

= + = +
= , ()
Por lo cual se concluye que este modelo de ajuste lineal no es el adecuado
para esta base de datos (ndice de correlacin de 0,4597); que ratifica la
ubicacin de los puntos en el diagrama de dispersin correspondiente.

ANLISIS DE REGRESIN CUADRTICA

Es el proceso por el cul encontramos la ecuacin de la parbola que mejor se


ajuste para un conjunto o serie de datos. Como resultado, obtenemos una
ecuacin de la forma:
= + + .

Donde 0.

La potencia predictiva relativa de un modelo cuadrtico est denotada por 2 .


El valor de 2 vara entre 0 y 1. Mientras ms cercano el valor est de 1, ms
preciso ser el modelo.

2 =

GEOESTADSTICA

( )( )
( 2 )( )
) + ( 2
)

( )2
( 2 )

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

89

Las expresiones matemticas (sistema de ecuaciones) consideradas como


normales para el ajuste cuadrtico correspondiente tenemos:

= + +
= + 2 +
2 = 2 + 3 + 4

[ 2

( )( )
( 2 )2
( 2 )( )
( 2 )( )
4
2
3

]
[
]
[
]
[
]

2
2
( )2
( 2 )2
3 ( )( )]

[ 2 ] [ 4
]
[

( 2 )( )
( )( )
( )2
( 2 )( )
2
3

]
[
]
[
] [
]

2
2
( )2
( 2 )2
3 ( )( )]

[ 2 ] [ 4
]
[

( ) ( ) ( 2 )
=[
]

= 2 + +

APLICACIN DEL AJUSTE CUADRTICO O PARABOLICO

La relacin entre el nivel de excavacin expresado en metros; y, la


determinacin del pH en los diferentes niveles extraccin del material; ha
facilitado la informacin cuantitativa que se detalla en el cuadro siguiente,
mediante los valores definidos cuantitativos; se requiere establecer el modelo

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

90

de ajuste que estadsticamente permita una mejor inferencia y estimacin entre


los parmetros establecidos; as como el anlisis de la dispersin de los datos
correspondientes:
"x" [m]

"y" [pH]

-3

7.5

-2

-1

0.5

14

a. Elaboracin del cuadro de valores para el modelo de ajuste

"n"

"x"

"y"

xy

x y

-3

7.5

-27

81

56.25

-23

67.5

-2

-8

16

-6

12

-1

0.5

-1

0.25

-0.5

0.5

16

36

12

24

14

27

81

196

42

126

TOTAL

35

28

196

307.5

28

233

b. Diagrama de dispersin de los datos

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

91

16
14
12
10
8
6
4
2
0
-4

-3

-2

-1

c. Determinacin de los valores de las constante y coeficiente de


correlacin

( )( )
( 2 )2
( 2 )( )
( 2 )( )
4
2
3

]
[
]
[
]
[
]

2
2
( )2
( 2 )2
3 ( )( )]

[ 2 ] [ 4
]
[

(28

(28)2
(28)(35)
(28)(0)
0 35
)
(196

) (0
7
7 ) (233
7
7 )
(0)2
(28)2
(28)(0) 2
(28 7 ) (196 7 ) (0
7 )

GEOESTADSTICA

2352
=
2352

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

[ 2

Pgin
a

92

( 2 )( )
( )( )
( )2
( 2 )( )
2
3

]
[
]
[
] [
]

2
2
( )2
( 2 )2
3 ( )( )]

[ 2 ] [ 4
]
[

(0)2
(28)(35)
(28)(0)
0 35
(28 7 ) (233
) (0
7
7 ) (28 7 )
=
(0)2
(28)2
(28)(0) 2
(28
) (196
) (0
)
7
7
7

2604
= ,
2352

( ) ( ) ( 2 )
=[
]

(35) 1(0) 1,107(28 )


=[
]
7
= ,

2 =

1 (28

2 =

GEOESTADSTICA

( )( )
( 2 )( )
2
)
+

( )2
( 2 )
(28)(35)
0 35
)
7 ) + 1,107 (233
7
(35)2
(307,5 7 )

121
= 0,913 = 0,96
132,5

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

93

Tambin se puede resolver como sistema de ecuaciones:

= + +
= + 2 +
2 = 2 + 3 + 4

35 = 7 + (0) + (28) = +
28 = (0) + (28) + (0) = =
233 = (28) + (0) + (196 ) = +

= + (4)(35 = 7 + 28) 140 = 28 112


= +

=
= + = =

= ,

Remplazando los valores obtenidos tenemos:

= + (, ) =

= ,

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

94

Ecuacin no lineal de ajuste (cuadrtica o parablica) ser:

= 2 + +
= , + + ,
Por lo cual se concluye que este modelo de ajuste lineal es el adecuado para
esta base de datos (ndice de correlacin de 0,96). Ecuacin de ajuste que
permite definir la relacin para los nuevos valores de las variables.

ANLISIS DE REGRESIN EXPONENCIAL

Otro tipo de funcin que tiene su aplicacin dentro del anlisis de regresin es
la funcin exponencial como ecuacin de ajuste para un conjunto o serie de
datos. Como resultado, obtenemos una ecuacin de la forma:

= .

Donde , 0.

Las expresiones matemticas par los ajustes exponenciales considerados


como normales para el ajuste correspondiente tenemos:
(ln ) = ln + ()()
(ln ) = ln + 1() ln = ln +

ln = n ln + ln ()
log() = ln + log()

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

95

[( )] ( )( )
( 2 ) ( )2

() =

Pgin
a

( ) ( )

( )
( )

( )( )

EJERCICIOS DE APLICACIN

La relacin entre el nivel de excavacin expresado en metros; y, la


determinacin del pH en los diferentes niveles extraccin del material; ha
facilitado la informacin cuantitativa que se detalla en el cuadro siguiente,
mediante los valores definidos cuantitativos; se requiere establecer el modelo
de ajuste que estadsticamente permita una mejor inferencia y estimacin entre
los parmetros establecidos; as como el anlisis de la dispersin de los datos
correspondientes:
"n"
1
2
3
4
5
6
7
TOTAL

"x"

"y"
-3
-2
-1
0
1
2
3
0

GEOESTADSTICA

7,5
3
0,5
1
3
6
14
35

lny
2,015
1,099
-0,693
0
1,099
1,792
2,639
7,951

x
9
4
1
0
1
4
9
28

x(lny)
-6,045
-2,198
0,693
0
1,099
3,584
7,917
5,05

(lny)
4,060
1,208
0,480
0
1,208
3,211
6,964
17,131

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

96

[( )] ( )( )
( 2 ) ( )2

7( 5,05 ) (0)(7,951) 35,35


=
= 0,1804
7(28) (0)2
196

() =

Pgin
a

( ) ( )

( )
( )

(7,951)0,1804(0)
7

( )( )

(7,951)
7

= 1,136 = 3,1138

(( ) ( )( )
[( 2 ) ( )2 ] [(()2 ) ( ln )2 ]

7(5,05) (0)(7,951)
[7(28) (0)2 ] [7(17,131) (7,951)2 ]
7(5,05)

[7(28)] [7(17,131) (7,951)2 ]

GEOESTADSTICA

= 0,3362

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

97

EJERCICIOS DE APLICACIN

La relacin entre los contenidos de arcilla y grava expresados en gramos


presentes diferentes en el estudio de material heterogneo; ha facilitado la
informacin cuantitativa que se detalla en el cuadro siguiente, mediante los
valores definidos cuantitativos; se requiere establecer el modelo de ajuste que
estadsticamente permita una mejor inferencia y estimacin entre los
parmetros establecidos; as como el anlisis de la dispersin de los datos
correspondientes:

"n"
1
2
3
4
5
TOTAL

"x"

"y"
21,4
15,7
12,1
8,5
5,2
62,9

6,9
12,9
19,8
26,7
35,1
101,4

lny
3,063
2,754
2,493
2,14
1,649
12,099

x
47,61
166,41
392,04
712,89
1232,01
2550,96

x(lny)
21,1347
35,5266
49,3614
57,138
57,8799
221,0406

(lny)
9,382
7,585
6,215
4,58
2,719
30,481

[( )] ( )( )
( 2 ) ( )2

5( 221,0406 ) (101,4)(12,099) 121,6356


=
5(2550,96) (101,4)2
2472,84
= 4,919 102 0,04919
() =

GEOESTADSTICA

( )
( )

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

( ) ( )

=
=

(12,099)(0,04919)(101,4)
5

Pgin
a

98

( )( )

(7,111134)
5

= 1,422268 = 4,146343
=

(( ) ( )( )
[( 2 ) ( )2 ] [(()2 ) ( ln )2 ]
5(221,0406) (101,4)(12,099)

[5(2550,96) (101,4)2 ] [5(30,481) (12,099)2 ]

1105,203 1226,8386
[2472,84] [6,019199]

121,6356
= 0,997
122,00212

Ecuacin de ajuste (exponencial) ser:

Mediante las expresiones matemticas para el ajuste exponencial como


ecuaciones normales tenemos:
(ln ) = ln + ()()
(ln ) = ln + 1() ln = ln 4,146343 + 0,04919
= , + ,
Por lo cual; se concluye que este modelo de ajuste exponencial es el adecuado
para esta base de datos (ndice de correlacin de 0,997); ecuacin de ajuste
que permite definir la relacin para los nuevos valores de las variables.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

99

REGRESIN LOGARTMICA

Otro tipo de funcin que tiene su aplicacin dentro del anlisis de regresin es
la funcin logartmica; como ecuacin de ajuste para un conjunto o serie de
datos. Como resultado, obtenemos una ecuacin de la forma:
= + ln()
Donde 0.

Las expresiones matemticas para el ajuste logartmico considerado como


normales tenemos:
= + ()
() = () + ()

[( )] ( )( )
()2 ( )2

( )

(( ) ( )( )
[ ()2 ( )2 ] [( 2 ) ( )2 ]

EJERCICIOS DE APLICACIN

La relacin entre los contenidos de arcilla y grava expresados en gramos


presentes diferentes en el estudio de material heterogneo; ha facilitado la

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

100

informacin cuantitativa que se detalla en el cuadro siguiente, mediante los


valores definidos cuantitativos; se requiere establecer el modelo de ajuste que
estadsticamente permita una mejor inferencia y estimacin entre los
parmetros establecidos; as como el anlisis de la dispersin de los datos
correspondientes:

"n"
1
2
3
4
5
TOTAL

"x"

"y"
29
50
74
103
118
374

1,6
23,5
38
46,4
48,9
158,4

lnX
3,367
3,912
4,304
4,635
4,771
20,989

y
2,56
552,25
1444
2152,96
2391,21
6542,98

Y(lnx)
5,3872
91,932
163,552
215,064
233,3019
709,2371

(lnx)
11,337
15,304
18,524
21,483
22,762
89,41

Las expresiones matemticas para el ajuste logartmico considerado como


normales tenemos:
= + ()
() = () + ()

158,4 = 5 + 20,989
709,2371 = 20,989 + 89,41 (20,989)

=
=

[( )] ( )( )
()2 ( )2

5[709,2371] (158,4)(20,989)
= 34,0190
5(89,41) (20,989)2
=

GEOESTADSTICA

( )

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

=
=

158,4
5

34,0190

20,989
5

Pgin
a

101

= 111,125

(( ) ( )( )
[ ()2 ( )2 ] [( 2 ) ( )2 ]
5(709,2371) (158,4)(20,989)

[5(89,41) (20,989)2 ] [5(6542,98) (158,4)2 ]


=

221,5279
= 0,9942
222,82

Como resultado, obtenemos una ecuacin de la forma:


= + ln() = , + , ()
Por lo cual se concluye que este modelo de ajuste lineal es el adecuado para
esta base de datos (ndice de correlacin de 0,9942). Ecuacin de ajuste que
permite definir la relacin para los nuevos valores de las variables

REGRESIN POTENCIAL

Otro tipo de funcin que tiene su aplicacin dentro del anlisis de regresin es
la funcin potencia; como ecuacin de ajuste para un conjunto o series de
datos. Como resultado, obtenemos una ecuacin de ajuste de la forma:
=

Las expresiones matemticas par los ajustes potenciales considerados como


normales para el ajuste correspondiente tenemos:

(ln ) = ln + ()

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

102

= () + ()
()() = () + ()

EJERCICIOS DE APLICACIN

A partir de la composicin de las aguas subterrneas y con el fin de evaluar su


potabilidad, se ha determinado la concentracin en iones de sodio de acuerdo
a su profundidad, cuyos valores del ion sodio se hallan expresados en mg/litro
Determinar la correlacin y la estimacin existente entre las variables cuando
su profundidad es de 40 pies

"x" profundidad
28
30
33
35
38

"y" [Na]
2410
3033
3895
4491
5717

Diagrama de dispersin de los datos


6000
5500
5000
4500
4000
3500
3000
2500
2000
15

GEOESTADSTICA

20

25

30

35

40

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

"n"
1
2
3
4
5
TOTAL

"x"
"y"
28
2410
30
3033
33
3895
35
4491
38
5717
164 19546.0

lnX
3.3322
3.4012
3.4965
3.5553
3.6376
17.423

(lny)(lnx)
25.9491
27.2684
28.9072
29.8999
31.4695
143.494

(lnx)
11.1036
11.5681
12.2256
12.6405
13.2320
60.770

(lny)
60.6433
64.2772
68.3507
70.7253
74.8433
338.840

[( )] ( )( )
()2 ( )2

5[143,494] (41,133)(17,423)
= 2,8011
5(60,770) (17,423)2

=
=

lny
7.7874
8.0173
8.2674
8.4098
8.6512
41.133

103


( )

41,133
17,423
2,8011
= 1.53411306
5
5
= 1.53411306 = 0,215647

(( ) ( )( )
[ ()2 ( )2 ] [ ()2 ( )2 ]
5(143,494) (41,133)(17,423)

[5(60,770) (17,423)2 ] [5(338,839) (41,133)2 ]


=

0,809741
= 0,99976
0,809932

Como resultado, obtenemos una ecuacin de la forma:


(ln y) = ln a + b(lnx) lny = 1,5341306 +2.8011(ln x)
y = 1.53411306 + 2.8011 x

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

104

y = 0,215647 + 2,8011x

Por lo cual se concluye que este modelo de ajuste potencial es el adecuado


para esta base de datos (ndice de correlacin de 0,99976). Ecuacin de ajuste
que permite definir la relacin para los nuevos valores de las variables

Ejercicio 2

De los resultados de un anlisis de suelos han seleccionado el porcentaje de


carbn orgnico y los contenidos de calcio cambiable

de entre otros

parmetros, para establecer la correlacin existente entre estos dos


parmetros seleccionados para definir la estimacin y ecuacin de ajuste
correspondiente entre las magnitudes y definir nuevos valores de acuerdo a la
informacin obtenida

"x" ( % C)
2.5
3
4
5
5.5
6
7

"y"[g de Ca]
12.5
10
7
4.5
4
3
3.5

Diagrama de dispersin de los datos:

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

105

14
12

g de Calcio

10
8
6
4
2
0
2

% de Carbono Orgnico

"n"
1
2
3
4
5
6
7
TOTAL

"x"
2.5
3
4
5
5.5
6
7
33

"y"
12.5
10
7
4.5
4
3
3.5
44.5

lnX
0.9163
1.0986
1.3863
1.6094
1.7047
1.7918
1.9459
10.453

lny
(lny)(lnx)
2.5257 2.3143
2.3026 2.5296
1.9459 2.6976
1.5041 2.4207
1.3863 2.3633
1.0986 1.9684
1.2528 2.4378
12.016
16.732

(lnx)
0.8396
1.2069
1.9218
2.5903
2.9062
3.2104
3.7866
16.462

(lny)
6.3793
5.3019
3.7866
2.2622
1.9218
1.2069
1.5694
22.428

[( )] ( )( )
() ( )

7[16,732] (12,016)(10,453)
= 0,2908807387
7(16,462) (12,016)2

GEOESTADSTICA


( )

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

12,016
7

0,29088

Pgin
a

106

(10,453)
= 1,2822
7

En este ajuste es necesario encontrar el antilogaritmo natural de a ser:


[ln(a) a = a ]

= 1,2822 = 3,6046

(( ) ( )( )
[ () ( ) ] [ () ( ) ]

7(16,732) (10,453)(12,016)
[7(16,462) (10,453)2 ] [7(22,428) (12,016)2 ]
8,47925
=
= 0,9773
8,6762

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

107

MODELO ESTADSTICO DE PRUEBA: ANLISIS DE VARIANZA (ANOVA)

El anlisis de varianza (ANOVA) es uno de los mtodos estadsticos ms


utilizados y ms elaborados en la investigacin moderna. El anlisis de la
varianza, no obstante su denominacin se utiliza para probar hiptesis
preferentes a las medias de poblacin ms que a las varianzas de poblacin.
La prueba Paramtrica Anlisis de Varianza; ANOVA, ANADEVA, ADEVA, se
ha desarrollado para el anlisis de datos en diseos estadsticos muy
complicados por lo que constituye uno de los mtodos ms efectivos para
comprobar una hiptesis.

El anlisis de varianza fue propuesto inicialmente por Ronald Aylmer Fisher ,


por el cientfico , matemtico , estadstico , bilogo evolutivo y genetista que
apareci publicado en 1923. Cinco aos antes Fisher haba usado los trminos
de varianza y anlisis de varianza, no para estudiar la varianza propiamente
dicha, sino para analizar la variacin experimental.

Tal como se conoce hoy da, el anlisis de varianza es una tcnica estadstica
que permite analizar datos provenientes de un experimento aleatorio
comparativo. El anlisis de varianza (ANOVA) se constituye en un conjunto de
procedimientos que se ajustan a las caractersticas del diseo experimental
usado en la obtencin de datos. No es un mtodo fijo, por el contrario, se
adapta a cada diseo particular. Si el diseo es unifactorial se aplica ANOVA
de clasificacin simple o de una va; si el diseo es multifactorial, el ANOVA
correspondiente ser de dos vas (dos factores), de tres vas (tres factores), y
as sucesivamente. Si se tiene un factor y una variable de agrupacin (diseo
de bloques) el ANOVA tambin es de dos vas. Si se tiene un factor y dos
variables de agrupacin (diseo de cuadro latino) el ANOVA ser de tres vas,
esto se generaliza al caso de n-vas de clasificacin.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

108

De acuerdo con el nmero de repeticiones se tiene ANOVA con grupos iguales


para diseos balanceados (igual nmero de repeticiones por tratamiento) y
ANOVA con grupos desiguales (diferente nmero de repeticiones por
tratamiento).

La forma de seleccionar los niveles de los factores tambin determina el tipo de


anlisis. Si los niveles son fijos o escogidos de antemano por el investigador,
se habla del modelo I de ANOVA o modelo de efectos fijos. Si los niveles son
seleccionados al azar de un grupo grande (poblacin), se aplica el modelo II o
modelo de efectos aleatorios, tambin llamado modelo de componentes de
varianza. El modelo III o modelo mixto es usado cuando hay factores con
niveles fijos y factores con niveles aleatorios en el experimento. La clasificacin
I, II o III, en este concepto, se debe a Eisenhart (1947).

El objetivo central del diseo experimental es la comparacin de dos o ms


tratamientos, cada uno de los cuales representa una poblacin, como es usual
en experimentos comparativos. Si, por ejemplo, se tiene un factor A con K
niveles o tratamientos, y cada uno de ellos est repetido r veces en el
experimento, cada unidad experimental produce una observacin, la cual se
analiza con base en un modelo estadstico llamado modelo lineal aditivo.

El anlisis de un experimento est basado, por lo general, en un modelo


matemtico para las observaciones, y este modelo matemtico est
relacionado y justificado por el diseo. Se puede asegurar que la aleatorizacin
es el paso que introduce los modelos probabilsticos para las observaciones.

Este hecho fue observado inicialmente por Fisher y es considerado


actualmente como una de sus mayores contribuciones al desarrollo de la
ciencia. Esta prueba exige el cumplimiento de algunos requisitos as tenemos:

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

109

Se supone que los elementos de los distintos grupos o subgrupos han


sido elegidos por muestreo aleatorio y de poblaciones de distribucin
normal

La varianza de los grupos o subgrupos tienen que ser homognea.

Las muestras que conforman los grupos o subgrupos han de ser


independientes.

La prueba es til al momento de comparar tres o ms grupos.

A continuacin se mostrar la caracterizacin matemtica a travs de la


formulacin

de

un

modelo

lineal,

tanto

con

el

uso

del

modelo

superparametrizado como por el modelo de medias de celdas o grupos.

MODELO ESTADSTICO DE PRUEBA F (Anlisis de Varianza o ANOVA)


ANLISIS DE VARIANZA PARA UNA CLASIFICACIN SIMPLE

MUESTRA

MEDICIONES COMPONENTES
A

1
2
3
4
5
6
7
8
Tabla 1. Coordenadas sitio de muestreo y Caractersticas de la muestras

HIPTESIS

(Plantear la hiptesis)

ENUNCIADO

OPERACIONAL

Describir la hiptesis considerando como complemento elNivel de confianza del


95 % y la prueba de F de Snedecor (La distribucin F es una distribucin de

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

110

probabilidad continua. Tambin se la conoce como distribucin F de Snedecor


o como distribucin F de Fisher-Snedecor.)

MODELO MATEMTICO. (Depende del nmero de componentes o elementos)


: = =
:
= ,
: ( )
( )
MODELO ESTADSTICO.
=

ANLISIS DE VARIANZA.
1. SUMA TOTAL DE LOS CUADRADOS ( ):

La suma Total de cuadrados se deduce hallando la media de las


puntuaciones; y, calculando las desviaciones de cada puntuacin respecto de
dicha media, elevando al cuadrado estas desviaciones y sumando los
resultados obtenidos. La Suma de cuadrados se deduce de la expresin:
( ) = ( )

( )

2. SUMA DE CUADRADOS ENTRE GRUPOS:

La suma de los cuadrados entre los diversos grupos se deduce hallando la


media de cada grupo de los componentes; calculando sus desviaciones
respecto de la media total, elevando al cuadrado estas desviaciones,
multiplicando cada una por el nmero de elementos de cada grupo (n) y
sumando los resultados obtenidos.
= [

GEOESTADSTICA

( )
( )
]

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

111

3. SUMA DE CUADRADOS DENTRO DE LOS GRUPOS:

Para obtener la suma de los cuadrados dentro de los grupos se resta cada
puntuacin, grupo por grupo, de la media del grupo, se elevan al cuadrado las
diferencias y se suman los resultados obtenidos. Caso contrario se analiza
cada uno de los grupos cuyos valores son:

Para el Grupo 1:
x2 = X2

( X)2
N

x2 = X2

( X)2
N

Para el Grupo 2

Para el Grupo 3
( X)2
x = X
N
2

Sumando los tres grupos


Xd2 = X12 + X22 + X32
La suma de cuadrados dentro de los grupos, ms la suma de cuadrados
entre grupos es igual a la suma de cuadrados total
=

4. GRADO DE LIBERTAD. ():

En el anlisis se tiene a partir del nmero de casos, por lo que los grados de
libertad: gl = (N 1), y de manera semejante se determina para cada grupo.

GEOESTADSTICA

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

112

5. EL ANLISIS DE LA VARIANZA

Dentro del Anlisis de la Varianza y como parte del proceso general es


necesario consolidar la informacin en la tabla que se describe a continuacin.
Para ello, en las distintas columnas se anota el nmero de grados de libertad,
la suma de los cuadrados para cada uno de los componentes en estudio y los
cuadrados medios. Estos ltimos se obtienen al relacionar cada una de las
sumas de los cuadrados por el nmero de grados de libertad correspondiente.
Los cocientes son autnticas varianzas. Los cuadrados medios dentro y
entre los grupos constituyen, por tanto, sendas estimaciones de la varianza
de la poblacin.
Tabla: Anlisis De La Varianza

ORIGEN O FUENTE DE VARIACIN

GRADOS DE
LIBERTAD [gl]

SUMA DE
CUADRADOS [SC]

CUADRADOS
MEDIOS [CM]

Tratamiento ENTRE Grupos


Tratamiento DENTRO de los
Grupos (internos)
TOTAL

6. CONTRASTE DE LA F FISHER- SNEDECOR


Dentro del proceso de Anlisis de la Varianza a partir de la Tabla se evala
determinando la relacin que se generaliza en la expresin siguiente:

F=

cuadrado medio "entre" componentes


cuadrado medio "dentro" delgrupo de componentes

Los valores de F se interpretan mediante la Tabla de distribuciones F se


Snedecor (Anexo 1) (Apndice E) para el nivel 5 por 100. En ella se encuentra
con el nmero de grados de libertad correspondiente al cuadrado medio mayor

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

113

por fila superior y con el nmero de grados de libertad del cuadrado medio
menor por la columna izquierda. Cuando el valor calculado de F es mayor por
tanto NO SE ACEPTA LA HIPTESIS NULA esto es que existe una diferencia
significativa de las medias a nivel del 5 por 100. Es importante recordar que
aunque en este contraste se utiliza un estadgrafo que es la razn de dos
varianzas, la hiptesis Nula consiste en afirmar la igualdad de las medias de las
muestras esto es: H0 : 1 = 2 = 3

Luego del anlisis de la informacin obtenida; y, al evidenciarse la existencia


de una diferencia significativa entre las medias de las muestras, por lo tanto es
necesario investigar dnde se encuentra la diferencia o diferencias.

Al

respecto si F calculado es mayor entonces se Rechaza la Hiptesis Nula.


Winer (1962) resumi media docena de mtodos diferentes para conseguirlo.
Algunos de ellos son ms rigurosos que otros, es decir reducen la probabilidad
de cometer un error de Tipo I.

PROBLEMAS DE APLICACIN:

Se busca determinar la influencia de la orientacin psicolgica en los mtodos


de crianza de los nios, mediante una comparacin entre liberales y
conservadores. Queremos hacer varias comparaciones que presenten varios
puntos en la escala psicolgica, podramos comparar la permisibilidad en la
crianza de los nios de conservadores, liberales, radicales y moderados.

N casos

CONSERVADORES

1
2
3
4

1
2
1
2

GEOESTADSTICA

MODERADOS

1
3
2
2

LIBRERALES

1
2
2
2

RADICALES

3
2
1
1

SEGUNDO CICLO

Pgin
a

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

MUESTRA

114

SOLUCIN NUTRITIVA
CUADRADO DE LAS CONCENTRACIONES
CONCENTRACIN EN KNO3 (g/L) de agua TC- A
TC- B
TC- C
TC- D

M1
M2
M3
M4

TC- A
1
2
1
2

TC1
3
2
2

TC-C
1
2
2
2

TC- D
3
2
1
1

X2
1
4
1
4

SUMATORIA

10

1,5

1,75

1,75

X2
1
9
4
4
18

X3
1
4
4
4
13

X4
9
4
1
1
15

1,75
ANLISIS DE VARIANZA.
SUMA TOTAL DE LOS CUADRADOS ( ):

La Suma Total de cuadrados se deduce hallando la media de las


puntuaciones; y, calculando las desviaciones de cada puntuacin respecto de
dicha media, elevando al cuadrado estas desviaciones y sumando los
resultados obtenidos (N = nmero de datos de todos los grupos). La Suma de
cuadrados se deduce de la expresin:
( ) = ( )

( ) = ( + + + )

( )

( + + + )
=

SUMA DE CUADRADOS ENTRE GRUPOS:

La suma de los cuadrados entre los diversos grupos se deduce hallando la


media de cada grupo de los componentes; calculando sus desviaciones
respecto de la media total, elevando al cuadrado estas desviaciones,
multiplicando cada una por el nmero de elementos de cada grupo (n) y
sumando los resultados obtenidos.
= [

( )
( )
]

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

= [

Pgin
a

115

()
()
]
=

X2= 10 + 8 + 13 + 15 = 56
XT = 6 + 8 + 7 + 7 = 28
T = 7 / 4 = 1.75

Frmula: Suma total de todos los cuadrados

n = nmero de datos de un grupo.

Clculo de:
SCinter = (

T)2 n

x1 = 6 x12 = 10

= 1.5

n=
4

x2 = 8 x22 = 18

=2

n = 4 xT = 28

x3 = 7

= 1.75 n = 4 T = 1.75

x32

= 13

x4 = 8 x42 = 15

= 1.75 n = 4 XT2 = 56

Grupo 1: (1.5 - 1.75)2 (4) = (-0.25)2 (4) = 0.6 (4) = 0.24


Grupo 2: (2 - 1.75)2 (4) = (0.25)2 (4) = 0.6 (4) = 0.24
Grupo 3: (1.75 - 1.75)2 (4) = (0)2 (4) = 0
Grupo 4: (1.75 - 1.75)2 (4) = (0)2 (4) = 0
SCinter = 0.24 + 0.24 + 0 + 0 = 0.48 Variacin que existe entre los grupos.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

116

Clculo de:

SCintra = 1 + 2 + 0.75 + 2.75 = 6.5

Comprobacin
SCT = SCinter + SCintra
SCintra = SCT - SCinter
SCinter = 0.48 = 0.5
SCintra = 6.5
SCT = 6.5 + 0.5 = 7
SCintra = 7 - 05 = 6.5

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

117

Prueba F (anlisis de varianza o ANOVA)


Raymundo
Veamos cuando se tienen puntuaciones de CI en 5 muestras de adulto.
Grupos 1

102 103 100 108 121


2

15 12 12 14 10

Se aprecia que varan las medias de los grupos. Esta variacin de las medias de grupo a
partir de la media total o global de todos los grupos, se conoce como varianza
intergrupal, la variabilidad promedio de las puntuaciones en cada grupo se denominan
varianza intergrupal. Ahora se colocan todas las puntuaciones de CI en una gran urna y
se mezclan en forma adecuada. Puede desentenderse por el momento cules
puntuaciones pertenecen a que grupos. Estas puntuaciones varan. La variacin de estas
puntuaciones individuales se denominan variacin total. El meollo del anlisis de
varianza radica en el siguiente hecho: si los grupos son muestras aleatorias provenientes
de la misma poblacin, las varianzas, intergrupal e intragrupal, son estimaciones
insesgadas de la misma varianza poblacional. Se prueba la significacin de la diferencia
de los 2 tipos mediante la prueba F.

Supuestos que fundamentan la aplicacin de anlisis de varianza.


Cuando se utiliza la tcnica anova se deben cumplir los siguientes supuestos:
1. Las personas de los diversos subgrupos deben seleccionarse mediante el
muestreo aleatorio, a partir de poblaciones normalmente distribuidas.
2. La varianza de los subgrupos debe ser homognea.
3. Las muestras que constituyen los grupos deben ser independientes. Amenos de
que las muestras sean independientes, y que por lo tanto, generen estimaciones
de varianza independientes, la razn de las varianzas inter e intra no adoptar la
distribucin F.

Ejemplo:

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

118

Se busca determinar la influencia de la orientacin psicolgica en los mtodos de


crianza de los nios, mediante una comparacin entre liberales y conservadores.
Queremos hacer varias comparaciones que presenten varios puntos en la escala
psicolgica, podramos comparar la permisibilidad en la crianza de los nios de
conservadores, liberales, radicales y moderados.

X2= 10 + 8 + 13 + 15 = 56
XT = 6 + 8 + 7 + 7 = 28
T = 7 / 4 = 1.75

Frmula: Suma total de todos los cuadrados.

N = nmero de datos de todos los grupos.


n = nmero de datos de un grupo.

Clculo de:
SCinter = (

T)2 n

x1 = 6 x12 = 10

= 1.5

n=
4

x2 = 8 x22 = 18

=2

n = 4 xT = 28

x3 = 7

= 1.75 n = 4 T = 1.75

x32

= 13

x4 = 8 x42 = 15

= 1.75 n = 4 XT2 = 56

Grupo 1: (1.5 - 1.75)2 (4) = (-0.25)2 (4) = 0.6 (4) = 0.24


Grupo 2: (2 - 1.75)2 (4) = (0.25)2 (4) = 0.6 (4) = 0.24

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

119

Grupo 3: (1.75 - 1.75)2 (4) = (0)2 (4) = 0


Grupo 4: (1.75 - 1.75)2 (4) = (0)2 (4) = 0
SCinter = 0.24 + 0.24 + 0 + 0 = 0.48 Variacin que existe entre los grupos.

Clculo de:

SCintra = 1 + 2 + 0.75 + 2.75 = 6.5

Comprobacin
SCT = SCinter + SCintra
SCintra = SCT - SCinter
SCinter = 0.48 = 0.5
SCintra = 6.5
SCT = 6.5 + 0.5 = 7
SCintra = 7 - 05 = 6.5

Calculamos la media cuadrtica (cuadrado medio)


Existe una media de variacin conocida como la media cuadrtica o varianza, que
obtenemos dividiendo SCintra o SCinter mediante los grados de libertad apropiados.
Clculo de la media cuadrtica:

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

120

glinter = K - 1 = 4 - 1 = 3
glintra = NT + K = 16 - 4 = 12

Otras medidas:
Coeficiente de Asimetra:

Se lo puede determinar a travs de las siguientes expresiones, dependiendo si


se trata de una serie de datos o de una tabla de frecuencias respectivamente:

1 n
x i x 3

n
a x i 1
S x 3

GEOESTADSTICA

1 n
x i x 3 f i

n
a x i 1
S x 3

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

Pgin
a

121

Ejercicio de Aplicacin
La altura de las 30 cascadas ms altas del mundo expresada en pies se detalla
a continuacin:
1112 1200 - 1230 1280 1259 1304 1325 1340 1476 1400
1476 1400 - 1500 1540 1612 1650 1600 1787 1841 1904 2000
2154 2120 2121- 2200 2415 2540 2625 - 3110 - 3212

Determinar las medidas de tendencia central, las medidas de dispersin en


base a los datos anteriores; y, especifique las respuestas obtenidas.

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

2.

Pgin
a

122

BIBLIOGRAFA.
FANTONI, Camba Hctor Curso de Estadstica General (Anlisis
Metodolgico). Segunda Edicin. 1975 Guayaquil- Ecuador.. Tomo I., 168
Pgs.

HABER,

Runyon.

Estadstica

General.

1986.

Addison-Wesley.

Iberoamericana. Impreso en E.U.A., 371 Pgs.

FANTONI, Camba Hctor Econ.Curso de Estadstica General (Anlisis


Matemtico). Segunda Edicin. 1990 Guayaquil- Ecuador. Tomo II.,217
Pgs.

STEVENSON, William. Estadstica para Administracin y Economa


Conceptos y Aplicaciones. Impreso en Mxico D.F. 1981. Editorial Harla.
S.A. 585 Pgs.

TARO YAMANE, Estadstica. Impreso en Mxico D.F. 1979. Editorial


Harla. S.A. 675 Pgs.

LINCOYAN PORTUS GOVINDER, Curso Prctico de Estadstica, Mc Graw


Hill Mxico 1988

GEOESTADSTICA

SEGUNDO CICLO

INGENIERIA EN GEOLOGIA AMBIENTAL Y ORDENAMIENTO


TERRITORIAL

GEOESTADSTICA

Pgin
a

123

SEGUNDO CICLO

S-ar putea să vă placă și