Documente Academic
Documente Profesional
Documente Cultură
El EDA proporciona mtodos sencillos para organizar y preparar los datos, detectar fallos en el
diseo y recogida de datos, tratamiento y evaluacin de datos ausentes, identificacin de altos
errticos.
El EDA deber ser completado en los datos crudos (ensayes) y en los datos tanto capeados
como compositado, mediante los histogramas detectamos los altos errticos. Para un primer
anlisis en los datos de ensayes se deber hacer por medio de boxplots para evaluar el
comportamiento del metal en las diferentes litologas presentes esto ser en funcin de una
codificacin numrica asignada a las litologas para facilitar su anlisis. De los resultados se
puede apreciar si la distribucin del metal es diferente en cada una de las litologas.
De lo observado en los boxplots por litologa u otro control ya sea estructural o de alteracin, se
podr definir si esa es o no uno de los controles en la mineralizacin, esto significa que la litologa
debe ser modelada obligatoriamente para optimizar la estimacin de recursos. Se deben agrupar
aquellas litologas donde la distribucin estadstica muestra similares caractersticas y donde se
tiene poca cantidad de datos, estas deben ser incluidas en las litologas mayores de acuerdo a
la ubicacin espacial. Hay casos en donde la litologa no puede ser usado debido a que no fue
interpretada lo que hace imposible su incorporacin en la base de datos de los compositos y su
aplicacin como control de los dominios de estimacin.
1. Base de Datos
El primer paso en un EDA es hacer accesible los datos a cualquier tcnica estadstica. Ello
conlleva la seleccin del mtodo de entrada, que sera archivos drivers como csv, txt, etc. Los
cuales son obtenidos de nuestra base de datos (SIOM), y codificacin de los datos que ser en
funcin de los slidos litolgicos, de alteracin, mineralgicos o estructurales (Ver tabla N 1) as
como la de un software estadstico adecuado para procesarlos, en nuestro caso ser el programa
SGeMS. (Ver Figura 1).
El archivo delimitado por comas deber ser nombrado segn la nomenclatura siguiente:
NOMBRE DE LA VETA-UNIDAD-EDA.csv
1
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Asimismo realizar un anlisis estadstico grfico y numrico de las variables del problema con el
fin de tener una idea inicial de la informacin contenida en el conjunto de datos as como detectar
2
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Para esto se utiliz el programa SGeMS, en donde se import la base de datos proporcionada
del SIOM en formato delimitado por comas y posteriormente se aplic un batch (que es un archivo
de aplicacin en formato delimitado por comas) el cual contiene la informacin sobre la forma,
datos de generacin y graficado del histograma.
3
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Una vez iniciada la aplicacin del SGeMS dentro del conjunto de algoritmos A_Utilities se
selecciona el algoritmo Data Load and Filter, en donde aparece un ventana de seleccin Data
en donde debemos direccionar el archivo en formato delimitado por comas e identificar las
columnas correspondientes a las coordenadas (los dems campos se dejan como esta por
defecto) una vez hecho esto se hace click sobre el comando Run Algorithm ubicado en la parte
inferior a manera de un botn, una vez hecho esto al lado derecho sobre la ventana Objects
aparecer la informacin cargada donde podr ser visualizada activando las casillas segn la
informacin que se desee visualizar; esto nos permite importar la base de datos codificada al
programa para su posterior anlisis y generacin de grficos.
Despus dentro del conjunto de algoritmos A_Utilities se selecciona el algoritmo Run a Batch
Mode Parameter File, el cual nos permite cargar mediante un archivo csv toda la configuracin
para la creacin de los histogramas, este archivo ser considerado como un batch.
4
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
nicamente se deber ubicar el archivo batch de donde se tuviese guardado y hacer click sobre
el comando Run Algorithm, con esto se generaran los histogramas en la ruta indicada en el
batch.
En la figura N6 se describe los campos necesarios utilizados para el correcto llenado de una
batch para su correcto uso y posterior generacin de histogramas.
Los archivos de salida que son en formato PostScript (.ps) debern ser nombrados de la siguiente
forma:
5
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Asimismo dentro del grfico los ttulos y subttulos del histograma debern ser contemplados de
la siguiente forma:
6
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Una vez generado los histogramas se realiza un examen grfico y un anlisis descriptivo
numrico que cuantifique las variables analizadas que para nuestro caso son los elementos a
estimar. Con esto se determina las poblaciones presentes as como los altos errticos.
Los altos errticos son observaciones con caractersticas diferentes de las dems., estos no
pueden ser caracterizados categricamente como benficos o problemticos sino que deben ser
contemplados en el contexto del anlisis y debe evaluarse el tipo de informacin que pueden
proporcionar. Su principal problema radica en que son elementos que pueden no ser
representativos de la poblacin pudiendo distorsionar seriamente el comportamiento de los
contrastes estadsticos. Por otra parte, aunque diferentes a la mayor parte de la muestra, pueden
ser indicativos de las caractersticas de un segmento vlido de la poblacin y, por consiguiente,
una seal de la falta de representatividad de la muestra.
La tercera clase contiene las observaciones cuyos valores caen dentro del rango
de las variables observadas pero que son nicas en la combinacin de los valores
de dichas variables. Estas observaciones deberan ser retenidas en el anlisis
pero estudiando qu influencia ejercen en los procesos de estimacin de los
modelos considerados.
Adems se debe evaluar, si fuera necesario, el impacto potencial que pueden tener los datos
ausentes (missing) sobre la representatividad de los datos analizados. El primer paso en el
7
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
tratamiento de datos ausentes consiste en evaluar la magnitud del problema. Para ello se
comienza analizando el porcentaje de datos ausentes por variables y por casos.
Si existen casos con un alto porcentaje de datos ausentes se deberan excluir del problema.
Asimismo si existe una variable con un alto porcentaje de este tipo de casos su exclusin
depender de la importancia terica de la misma y la posibilidad de ser reemplazada por variables
con un contenido informativo similar.
Como regla general, sin embargo, si dicha variable es dependiente debera ser eliminada ya que
cualquier proceso de imputacin de valores puede distorsionar la significacin estadstica y
prctica de los modelos estimados para ella.
b) Mtodos de sustitucin, que estiman valores de reemplazo para los datos ausentes,
sobre la base de otra informacin existente en la muestra. As se podra sustituir observaciones
con datos ausentes por observaciones no maestrales o sustituir dichos datos por la media de los
valores observados o mediante regresin sobre otras variables muy relacionadas con aquella a
la que le faltan observaciones.
3.1 Capping
Una vez determinados los altos errticos y haciendo el anlisis respectivo se procede al capeo
de los mismos los cuales son aplicados a una columna gemela del elemento original (para no
perder la data original) esta ser llamada usando el nombre original del elemento pero
agregndole el sufijo Cap sobre la cual se continuaran con los dems procesos de
compositacin y estimacin. Para nuestro caso analizando las grficas se determin valores
corte en el lmite superior de las curvas de probabilidad de los ensayes los cuales fueron
reemplazados en las columnas gemelas por los valores que superen este lmite.
8
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
El archivo delimitado por comas deber ser nombrado segn la nomenclatura siguiente:
NOMBRE DE LA VETA-UNIDAD-EDA-CAP.csv
9
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Adems se gener una serie de boxplot por dominios para evaluar la relacin entre cada una de
las zonas y corroborar que las zonas definidas anteriormente necesitan ser reagrupadas o no
considerando las variables geolgicas (litologa, alteracin u otros) para el proceso de
estimacin, estas variables permitirn controlar mejor el coeficiente de variacin observado en
los dominios previos.
10
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Estos grficos fueron generados en el SGeMS, la forma de cargado de datos es la misma que
para los histogramas pero con la variante que el batch de generacin de boxplot difiere en su
estructura con el anterior batch para generacin de histogramas (mencionado en el punto 2
Histogramas y Curvas de Probabilidad).
Los archivos de salida que son en formato PostScript (.ps) debern ser nombrados de la siguiente
forma:
11
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Figura 10: Descripcin de un batch para generar boxplot para los datos compositados
12
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Se realizaron grficos de contact plot entre dominios los cuales nos permitieron ver el grado de
influencia de las leyes entre ambos dominios examinados, estos muestran el valor promedio de
las leyes de los elementos analizados y el nmero de compsitos, desde el contacto a distancias
de intervalos de 10 metros.
Tipo de Contacto Suave (Soft), indica que en la interpolacin del modelo de bloques
todos los compsitos intervienen en el proceso, no tienen ninguna restriccin entre
dominios.
Tipo de Contacto firme (Firm), este tipo de contacto tiene influencia con el dominio
vecino, los compsitos del dominio tiene una influencia de 10 metros o ms con respecto
al otro. En el proceso de interpolacin solo intervienen aquellos compsitos que estn
dentro del dominio ms aquellos compsitos que estn a 10 metros o ms fuera del
dominio.
Tipo de Contacto Duro (Hard), este tipo de contacto indica que en el proceso de
interpolacin solo intervienen los compsitos del dominio, los compsitos de los vecinos
adyacentes no tiene ninguna intervencin en el proceso de interpolacin.
Estos grficos tambin fueron generados por el programa SGeMS, la forma de cargado de datos
es la misma que para los histogramas de los ensayes o datos crudos pero con la variante que el
batch de generacin del contact plot difiere en su estructura con el anterior batch para generacin
de histogramas (mencionado en el punto 2 Histogramas y Curvas de Probabilidad).
Los archivos de salida que son en formato PostScript (.ps) debern ser nombrados de la siguiente
forma:
13
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Figura 11: Descripcin de un batch para generar contactplot para los datos
compositados.
14
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
7. Variografa
Los variogramas para los metales, fueron evaluados en cada uno de los dominios, se ha usado
el mtodo del correlograma por que ste normaliza la covarianza por la varianza de los datos
usados en cada salto (distanciamiento entre muestras). A pesar que el trmino variograma es
usado en el resto de documento, el mtodo real en todos los casos es el correlograma. Los
variogramas experimentales en varias direcciones fueron generados y modelados con la ayuda
del software Studio 3D.
15
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
En la segunda pestaa Fields del comando VGRAM se coloca las columnas correspondientes a
las coordenadas as como los elementos a calcular la variografa. Ver detalle tabla N 2.
Nombre Descripcin
X Coordenada X de los datos de muestras. El nombre por defecto es X.
Y Coordenada Y de los datos de muestras. El nombre por defecto es Y.
Z Coordenada Z de los datos de muestras. El nombre por defecto es Z.
F1 Primer elemento para clculo de variografa.
F2 2do elemento para clculo de variografa.
F3 3ro elemento para clculo de variografa.
F4 4to elemento para clculo de variografa.
F5 5to elemento para clculo de variografa.
F6 6to elemento para clculo de variografa.
F7 7mo elemento para clculo de variografa.
F8 8vo elemento para clculo de variografa.
F9 9no elemento para clculo de variografa.
F10 10mo elemento para clculo de variografa.
F11 11mo elemento para clculo de variografa.
F12 12mo elemento para clculo de variografa.
F13 13ro elemento para clculo de variografa.
F14 14to elemento para clculo de variografa.
F15 15to elemento para clculo de variografa.
F16 16to elemento para clculo de variografa.
F17 17mo elemento para clculo de variografa.
F18 18vo elemento para clculo de variografa.
F19 19no elemento para clculo de variografa.
F20 20mo elemento para clculo de variografa.
F21 21ro elemento para clculo de variografa.
F22 22do elemento para clculo de variografa.
F23 23ro elemento para clculo de variografa.
16
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Figura 13: Seleccin de columnas para hacer los clculos en el comando VGRAM.
Finalmente en la tabla N3 podemos ver la pestaa Parameters donde se configuran los campos
de generacin del variograma; algunos campos son: LAG (que es dos veces la distancia de
muestreo), LAG TOL (o tolerancia, que es la mitad del LAG), NLAGS (cantidad de lags), AZI (el
azimuth del inicio de variograma), HORANG (la tolerancia angular), entre otros; para mayor
detalle ver la Tabla N 3.
17
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Nombre Descripcin
LAG Distancia para un lag.
LAGTOL Tolerancia a ser usada cuando se selecciona los pares de muestras, puede ser entre 0 y la mitad de un lag.
NLAGS Numero de lag.
NSUBLAG Es la divisin del lag entre la cantidad de sublag.
NLAGS1 cantidad de lag a ser divididos entre sublags
AZI Azimuth del primer variograma
HORANG Angulo de regularizacin del azimuth
DIP Direccin del Dip del primer variograma
VERANG Angulo de regularizacin del dip
CYLRAD Radio de bsqueda cilndrica, se pone 0 si no aplica
NUMHOR Numero de azimuth, el mximo nmero de variogramas individuales es este valor.
HORINC Incremento en el ngulo del azimuth.
NUMVER Numero de dips
VERINC Incremento en el ngulo del dip.
ALLKEYS Este parmetro controla si los variogramas individuales son calculados en si o el promedio de ellos
KEYMETH Controla si los variogramas respetan los dominios para los clculos.
CROSSVAR Controla si los variogramas y/o variogramas cruzados son calculados
INDSTEP Paso entre sucesivos indicadores de corte, dejar en 0 a menos que se tenga un archivo de corte
INDMIN El menor indicador del valor de corte, dejar en 0
INDNUM El nmero de indicadores a usar, dejar en 0
NESTED Mtodo de clculo de indicadores, dejar en 0
PRINT Alarma para controlar la salida de los grficos
ANGLE1 Primer ngulo de rotacin
AXIS1 Primer eje de rotacin, 1=X, 2=Y, 3=Z. 0 significa que no hay rotacin
ANGLE2 Segundo ngulo de rotacin
AXIS2 Segundo eje de rotacin, 1=X, 2=Y, 3=Z. 0 significa que no hay rotacin
ANGLE3 Tercer ngulo de rotacin
AXIS3 Tercer eje de rotacin, 1=X, 2=Y, 3=Z. 0 significa que no hay rotacin
LOGCON Si el valor de la muestra es menor que LOGCON, este se reemplaza por 0.001
ADDCON Constante agregada al campo a calcular antes del clculo en si
LAYMETH Mtodo de capas, para depsitos estratificados conviene calcular por capa y en total.
SPACING Las muestras son asignadas a un nmero de capa relativo a la rotacin del plano XY.
PAUSE Retraso en segundos entre la salida de cada variograma
PROMPT Numero de lneas a ver en la pantalla cuando los resultados van saliendo.
18
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
19
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
En la parte de Input File se agrega el archivo variograma creado anteriormente donde despus
de activar la opcin Draw Perpendicular Variograms y seleccionar el elemento a trabajar en
Value Field se selecciona el mejor variograma segn las direcciones calculadas. (Ver figura 17).
Si el variograma fue hecho segn dominios estos debern verse reflejado en la ventana Key
Fields y en Key Values.
En la ventana Format se grada los ejes para una mejor visualizacin, asimismo se normaliza el
variograma, se muestran los pares y las coordenadas en proyeccin UTM haciendo check en las
casillas correspondientes. (Ver Figura 18)
20
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
21
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
Una vez terminado se nombra el modelo en Current Model File para finalmente grabarlo. Si se
hiciese para varios elementos se mantiene el nombre en el Current Model File pero se enumera
en el nmero de referencia una vez que sale la ventana de Save Model As ponindole una
pequea descripcin. (Ver Figura 21)
Una vez terminado el modelamiento variogrfico el archivo deber ser grabado de la forma:
VARIO-NOMBRE DE LA VETA-UNIDAD.dm
Finalmente grabado el archivo variograma este ser el que se use en el proceso de estimacin.
22
Procedimiento de Estimacin de Recursos
Febrero 2014
ANALISIS EXPLORATORIO DE DATOS EDA - VARIOGRAFIA
Por Jorge Snchez Espinoza Gelogo Senior de Modelamiento y Recursos Minerales
23
Procedimiento de Estimacin de Recursos
Febrero 2014