38
Informe: Proyecto N°2 Análisis Geoestadístico de Datos Integrantes: Eduardo Retamales Jaier Rosas !a"ián #árdenas Profesor: $aier Emery #urso: %I&'&' !ec(a de entrega: & de )ulio 2'*+ 0 MI4040 – Análisis Estadístico y Geoestadístico de Datos

Final Informe 2 Geoestadistica

Embed Size (px)

DESCRIPTION

dgdfd

Citation preview

Informe: Proyecto N2 Anlisis Geoestadstico de Datos

Integrantes: Eduardo Retamales Javier Rosas Fabin Crdenas Profesor: Xavier Emery Curso: MI4040 Fecha de entrega: 4 de julio 2013 Abstract

The following report presents aexploratory analysis and a variografics analysis of data from a Database of cupper law ,where thas laws of soluble copper (CuS) and total copper ( CuT) was obtained from drilling of exploration. This report provides a comprehensive analysisof a statistical nature, in order to find Trends and relation ships between different types of data. This is to estimate the law of CuS and CuT blocks. As main objective, were calculated the resources of CuS and CuT. Was usedas an essential tool the computer program"ISATIS", whichwasimported the data of the project 1 "Datos.xls". Exploratory and variografics analysis was performed of the data, continuing with the cross-validation.It was createda grid of blocks with the purpose of estimating local laws of CuS and CuT.Finally ,were calculated resources in tonnage, average grades and quantities.

ContenidoAbstract1Introduccin3Anlisis Exploratorio de Datos4Cobre soluble4Cobre Total5Desagrupamiento6Otras herramientas geoestadsticas7Mapas Variogrficos9Variograma experimental CuT11Variograma modelo de CuT12Variograma experimental CuS14Variograma modelado Cobre soluble14Validacin por Jack-Knife17Creacin de Grilla23Preparacin a la creacin de Grillas23Creacin y ajuste de la grilla25Definicin de la grilla completa25Estableciendo una zona de seleccin26Estimacin por Krigging29Estimaciones de Leyes de cobre para bloques29Estimacin para Cobre Soluble30Estimacin para Cobre Total31Conclusiones34Bibliografa35

Introduccin

El presente informe tiene como objetivo calcular los recursos in situ y los recursos recuperables de cobre total (CuT) y cobre soluble (CuS) mineral que estn disponibles, lo cual se obtiene a travs de informacin de sondajes de exploracin, esto en el contexto del Proyecto N2 del curso Anlisis Estadstico y Geoestadstico de datos.Para aquello se har un anlisis geoestadstico completo de una base de datos con informacin sobre ley de cobre total y cobre soluble y sus respectivas coordenadas geogrficas y cota. Dicha base de datos cuenta con 1546 muestras.El anlisis se inicia con el proceso de importacin de datos desde el archivo Datos.xls al software Isatis; posteriormente se realiza un estudio exploratorio de datos que permite identificar la existencia de errores, anomalas e informacin redundante en la muestra. Se eliminarn las muestras errneas de manera que se trabajar sobre una base de datos ms confiable. Luego se procede a realizar el anlisis variogrfico para cada variable, e identificar las direcciones de mxima variacin, para luego ajustar un modelo variogrfico necesario para el kriging.Antes de realizar el kriging es necesario hacer la validacin cruzada para verificar tanto el modelo variogrfico como para la vecindad de bsqueda. Adems se debe definir la correspondiente grilla y el tamao de la discretizacin de bloques.Una vez hecho el kriging, se presentan los datos obtenidos para cada variable a travs de histogramas de estimacin y varianza, y del mapa a escala de colores que representan la distribucin espacial de las variables y su varianza.Finalmente se calculan los recursos disponibles a travs de la curva de Tonelaje-Ley, y en especial para una ley de corte del Cu de 0,35%.

Anlisis Exploratorio de Datos

Se realizar un anlisis a grandes rangos utilizando el programa Isatis. Se utiliz la base de datos de Excel pretratada en el Informe 1, sin los outliers ni duplicados detectados en dicho estudio. Slo se analizan los datos de Sondajes, a menos que se explicite lo contrario.

Cobre soluble

En primer lugar, se elabor el mapa de los datos (figura 1-A):

Se observa en la figura 1 un outlier (valor de 3.58 en rojo) que no se excluy en el estudio estadstico del Informe 1. Al excluir este valor del estudio geoestadstico del presente informe, se obtuvo el mapa de la figura 3.

En segundo lugar se calcularon los estadsticos globales de los datos y se gener un histograma.

Cobre Total

A continuacin se elaboraron el mapa de datos sin el outlier detectado (en el mismo punto en que se excluy el valor de CuS - fig. 5) y el histograma (fig. 4). Se puede observar que se tomaron mediciones de CuT y CuS en los mismos puntos, lo cual en general es conveniente para los estudios geoestadsticos. Esta observacin se ratifica al revisar las coordenadas en el archivo Excel.

Desagrupamiento

A continuacin se muestran los cambios en los estadsticos principales de las muestras de CuS y CuT al realizar un desagrupamiento por el mtodo de las celdas, con celdas de 100[m] X 100[m] X 10[m], pues 100 m se consider el espaciamiento promedio de datos en ambos ejes del mapa, y 10 [m] cubren el rango de cotas (alturas) que se tiene. Se observa un gran efecto sobre los estadsticos, debido a los tres claros clusters que se observan en los mapas.Tabla 1. Estadsticos principales para el CuS, antes (raw) y despus (weighted) del desagrupamiento.

Tabla 2.Estadsticos principales para el CuT, antes (raw) y despus (weighted) del desagrupamiento.

Otras herramientas geoestadsticas

Grfico Cuantil contra Cuantil entre ambas variables: se observa en la figura 6 que ambas variables tienen distribuciones de formas similares (se tiene casi una recta), y adems que tienen dispersiones similares (recta es cercana a una paralela de la diagonal), lo que concuerda con los valores de las desviaciones estndar, de 0.33 (CuT) y 0.29 (CuS). Sin embargo, la diferencia entre medias hace que la "recta" obtenida sea lejana a la diagonal.

Nube de dispersin o correlacin: se observa en la figura 7 que hay una altsima correlacin entre ambas variables, dndose que en los sectores de mayor ley de CuT hay mayor ley de CuS, lo cual hace sentido.

Nubes de dispersin diferida: la forma de las figuras 8A y 8B se debe a la alta dispersin (medible en la razn entre la desviacin estndar y la media). Para los clculos se utiliz un paso de 100 [m] con tolerancias de 20 [m] y de 90.

Para finalizar el anlisis exploratorio de datos, se realiza un estudio de cuantil contra cuantil, para comparar las distribuciones de los datos, en las siguientes ilustraciones se detallan los resultados.

Mapas Variogrficos

Esta herramienta consiste en calcular y visualizar el variograma experimental en todas las direcciones del espacio, bajo la forma de un mapa de color. De este modo, se puede distinguir si existe anisotropa y calcular el variograma a lo largo de las direcciones principales de la anisotropa.en primer lugar se elabor el mapa variogrfico del CuT, utilizando los parmetros indicados en la tabla 3. Se debi reajustar la escala de colores respecto de la utilizada en los mapas de datos, para poder visualizar con claridad el mapa variogrfico.Tabla 3. Parmetros utilizados para la elaboracin de los mapas variogrficos de CuT y CuS.Plano de referenciaN DireccionesN PasosLargo Paso Tolerancia en distanciaTolerancia en direccinMnimo de pares

Sin rotacin181250 [m]1 [paso]1 [sector]1

CuTCuS

En las figuras se observa que existen dos direcciones preferenciales de anisotropa: N40E y N130E, que son perpendiculares y por tanto sern las utilizadas para la elaboracin de los variogramas direccionales.

Variograma experimental CuT

Tabla 4. Parmetros utilizados para la elaboracin de los variogramas de CuT y CuS. *Vase figura 10.Ancho de bandaAltura de bandaTolerancia en nguloPaso*N Pasos*Tolerancia en distancia

170 [m]10 [m]10 75 [m]80.5 pasos

Figura 10. A la izquierda se muestra el variograma de CuT con un paso de 50 [m]. A la derecha, con un paso de 75 [m]; este ltimo fue el variograma elegido para elaborar el variograma modelado, dado que es ms suave, haciendo ms fcil la evaluacin y ajuste visual de dicho modelo.

Variograma modelo de CuT

a continuacin se explica el desarrollo del modelo en base a observaciones del variograma experimental. Hay un efecto pepita de aproximadamente 0.039 (ajustado automticamente). A pesar de la eleccin cuidadosa del paso, hay una alta variabilidad que dificulta la determinacin de las mesetas; por tanto se utiliz el ajuste automtico de mesetas. Para las dos direcciones se utilizaron modelos esfricos, dado su comportamiento lineal cerca del origen. Para el variograma N40E el alcance usado fue de 100 [m] en una direccin y de 150 [m] en la otra, y la meseta fue de 0.069. Para el variograma N130E el alcance usado fue de infinito en una direccin (para no modificar el modelo de N40E) y 150 [m] en la otra, y la meseta de 0.006. El variograma experimental hacen pensar que podra existir un efecto de hoyo, sin embargo no se incorpor en el modelo, pues se consider que lo ms importante es ajustarse al sector de distancias h bajas pues ste es el sector de mayor confiabilidad del variograma.

Se realiz una validacin cruzada de este modelo, con kriging ordinario (por defecto). Se consider un umbral de errores estandarizados de 2.5 (los datos son considerados "mal estimados", y marcados con un crculo relleno en la figura 12, cuando el error estandarizado est fuera del intervalo [-2.5, 2.5]). Adems, se utiliz para estimar una vecindad mvil en forma de elipse de radio mayor 200 [m] en la direccin N40E y radio menor 125 [m] (y radio de altura 10 [m]).

Los resultados obtenidos en la validacin se enumeran a continuacin: Los valores de la media y varianza del error son cercanos a cero, es decir, son aceptables. La varianza del error estandarizado es relativamente cercana a 1, sin embargo sera deseable que fuese mayor (vanse valores en tabla 5). Los datos "mal estimados" fueron 24, que corresponden a un 2% del total de 1190 datos. Relacionado a lo anterior, la figura 12-B muestra que a pesar que hay una cierta dispersin, la mayora de los valores son cercanos a la diagonal, es decir, estn bien estimados. Todo lo anterior valida el modelo, es decir, lo hace digno de ser utilizado en el kriging.Tabla 5. Estadsticos relacionados a la validacin cruzada del modelo variogrfico desarrollado para el CuT.

Variograma experimental CuS

Se utilizaron los mismos parmetros que para el variograma CuT.

Variograma modelado Cobre soluble

Nuevamente se utiliz el ajuste automtico de mesetas. Hay un efecto pepita de aproximadamente 0.042 . Para las dos direcciones se utilizaron modelos esfricos, dado su comportamiento lineal cerca del origen. Para el variograma N40E el alcance usado fue de 100 [m] en una direccin y de 150 [m] en la otra, y la meseta fue de 0.042. Para el variograma N130E el alcance usado fue de infinito en una direccin (para no modificar el modelo de N40E) y 150 [m] en la otra, y la meseta de 0.007. El variograma experimental hacen pensar que podra existir un efecto de hoyo, sin embargo no se incorpor en el modelo, pues se consider que lo ms importante es ajustarse al sector de distancias h bajas pues ste es el sector de mayor confiabilidad.

Se realiz una validacin cruzada de este modelo, con kriging ordinario (por defecto). Se consider un umbral de errores estandarizados de 2.5 (los datos son considerados "mal estimados", y marcados con un crculo relleno en la figura 12, cuando el error estandarizado est fuera del intervalo [-2.5, 2.5]). Adems, se utiliz para estimar una vecindad mvil en forma de elipse de radio mayor 200 [m] en la direccin N40E y radio menor 125 [m] (y radio de altura 10 [m]). Los resultados obtenidos en la validacin se enumeran a continuacin: Los valores de la media y varianza del error son cercanos a cero, es decir, son aceptables. La varianza del error estandarizado es relativamente cercana a 1, sin embargo sera deseable que fuese mayor (vanse valores en tabla 5). Los datos "mal estimados" fueron 17, que corresponden a un 1.4% del total de 1190 datos. Relacionado a lo anterior, la figura 12-B muestra que a pesar que hay una cierta dispersin, la mayora de los valores son cercanos a la diagonal, es decir, estn bien estimados. Todo lo anterior valida el modelo, es decir, lo hace digno de ser utilizado en el kriging, lo cual no quiere decir que no se podran encontrar mejores aproximaciones.Tabla 6. Estadsticos relacionados a la validacin cruzada del modelo variogrfico desarrollado para el CuS.

Validacin por Jack-Knife

Estimacin CuT pozos: se utiliz para esta validacin ms elaborada una vecindad mvil igual a la utilizada en las validaciones cruzadas de la seccin anterior; se realiz un kriging puntual estimando los valores en todos los puntos de medicin de pozos, y se compar con los valores medidos reales de pozos. En los mapas de datos (figura 13) se observa claramente la mayor suavidad (homogeneidad) de los datos estimados, tenindose un comportamiento espacial general similar a la realidad, pero con mucha menor dispersin. Lo anterior es tpico de cualquier estimacin por kriging y para evitar este tipo de inexactitudes se necesita utilizar mtodos multivariables de estimacin geoestadstica. En los histogramas se observa nuevamente que los datos estimados tienden a ser ms bajos: las fracciones estimadas son ms altas que las reales hacia los valores ms bajos y hacia los valores ms altos (extremos) las fracciones estimadas son ms bajas que las reales. En el mismo sentido, el mximo estimado es mucho menor que el real y la media estimada es considerablemente menor que la real. El hecho que la dispersin de los datos estimados es menor que la de los datos reales, ya percibido en los mapas, se vuelve a notar aqu al comparar las desviaciones estndar. En la figura 15-A se observa que la varianza del Kriging es mxima en dos sectores (amarillos): esto implica que la confiabilidad de los datos estimados es mnima justo en esos dos sectores. Adems, se observa en la figura 13 que justamente en estos sectores hay un gran error (una gran diferencia entre datos estimados y reales).En la figura 15-B se muestra la nube de correlacin entre los valores reales (CuT) y estimados (Krig CuT). Se observa una gran masa de datos bien estimados (la lnea negra es una diagonal, pues los ejes usados no son de la misma escala), pero tambin una gran cantidad de datos mal estimados.

Estimacin CuS pozos:

De forma similar a lo ocurrido con el CuT, en los mapas de datos se observa claramente mayor suavidad (homogeneidad) en los datos estimados, tenindose sin embargo un comportamiento espacial general similar a los datos reales.En los histogramas se observa nuevamente que los datos estimados tienden a ser ms bajos: las fracciones estimadas son ms altas que las reales hacia los valores ms bajos y hacia los valores ms altos (extremos) las fracciones estimadas son ms bajas que las reales. En el mismo sentido, el mximo estimado es mucho menor que el real y la media estimada es menor que la real. El hecho que la dispersin de los datos estimados es menor que la de los datos reales, ya percibido en los mapas, se vuelve a notar aqu al comparar las desviaciones estndar.

En la figura 15-A se observa que la varianza del Kriging es mxima en dos sectores (amarillos y rojos): esto implica que la confiabilidad de los datos estimados es mnima justo en esos dos sectores. En la figura 15-B se muestra la nube de correlacin entre los valores reales (CuT) y estimados (Krig CuT). Se observa una gran masa de datos bien estimados (la lnea negra es una diagonal, pues los ejes usados no son de la misma escala), pero tambin una gran cantidad de datos mal estimados.Respecto del anlisis realizado para la estimacin de CuT y CuS de pozos (la validacin jack-knife), se puede concluir que los modelos de variograma desarrollados permiten representar la continuidad espacial de la variable, pues dan origen a buenas estimaciones en prcticamente todo el espacio. Sin embargo, y como en cualquier estimacin por kriging, hay inexactitudes y errores que pueden sesgar decisiones tomadas en base a estas estimaciones; lo anterior es inevitable y algunas formas de disminuir este sesgo son utilizar otros mtodos de estimacin o tomar ms datos en terreno (pues a mayor cantidad de datos mejor es la estimacin obtenida en base a ellos).

Creacin de Grilla

Preparacin a la creacin de Grillas

Para la creacin de las grillas es necesario ajustar los valores filtrados, es decir sin datos aberrantes ni duplicados, lo ms posible usando bloques de 10x10x10 hasta obtener una discretizacin apta para utilizar la tcnica de krigging posteriormente. Dado que nuestro banco de inters se encuentra alrededor de la cota 2885m, nos pareci necesario graficar en un mapa bsico las cotas y de esta forma encontrar estadsticas y posiblemente datos aberrantes.

En rojo podemos ver la cota que sale del banco de inters, y aqu su valor en las estadsticas, que correspondera al mximo:

Luego de quitar los valores aberrantes tanto por concepto de ley y cota, tenemos el siguiente mapa bsico, en donde apreciamos que todos los valores estn cercanos a la cota 2885m,

Y la estadstica lo confirma:

Por lo tanto ahora se est en condiciones de comenzar a trabajar sobre este banco de inters, comenzando por el ajuste de las grillas y seleccionando una zona de inters para el krigging.

Creacin y ajuste de la grilla

Definicin de la grilla completa

El primer paso para lograr un ajuste de la grilla a nuestros datos de sondaje fue obtener los valores mnimos y mximos para la ubicacin regional de datos, es decir para el este, norte y la cota. Para lograrlo se hizo uso de las estadsticas proporcionadas por Isatis:

Con estos valores es posible comenzar la discretizacin, comenzando con valores iniciales para la cota de 2.88 km, para la coordenada Este de 0.08km y para la coordenada Norte de 0.15km. Usando bloques de 10x10x10 son necesarios 2 bloques en la cota, 92 bloques hacia el Este y 125 bloques hacia el Norte para cubrir los datos obtenidos por sondaje hasta el ltimo punto.

Grilla total Plano X-Y

Grilla total Plano Y-Z

Acercamiento Grilla total Plano Y-Z

Por lo tanto tenemos una grilla tridimensional formada por 23000 Nodos o bloques de 10x10x10 . Pero como se puede apreciar de mapas bsicos obtenidos en nuestra primera etapa de anlisis, muchos de estos datos se encuentran aislados y por lo tanto hay zonas en donde hacer krigging simplemente no sera representativo, esto nos lleva a pensar que la zona de trabajo debe reducirse a una filtrada, en donde las estimaciones obtenidas si tengan una cercana a la realidad. Estableciendo una zona de seleccin

Para establecer una zona de seleccin a partir de los 23000 bloques debemos usar los datos tanto de cobre soluble como de cobre total y a partir de eso obtener dos zonas distintas, representativas para cada tipo de cobre.Zona para cobre solubleSe comienza la seleccin proyectando los datos de cobre soluble sobre la grilla total,Luego se procede a desechar aquellos bloques que no estn en la cercana de los datos obtenidos por sondaje, a fin de crear una zona de seleccin representativa, obteniendo como resultado lo siguiente:

La seleccin se realiz sobre una grilla de 23000 bloques, de los cuales 8286 fueron desestimados y 14714 seleccionados para el proceso de Krigging.Zona de seleccin para cobre totalRealizando el mismo procedimiento anterior, se obtiene:

La seleccin se realiz sobre una grilla de 23000 bloques, de los cuales 8580 fueron desestimados y 14420 seleccionados para el proceso de Krigging.

Estimacin por Krigging

Estimaciones de Leyes de cobre para bloques

Usando las mismas caractersticas de la elipse encontrada en los primeros estudios del informe, e incorporando las nuevas zonas de seleccin, fue posible obtener las estimaciones de las leyes de los bloques antes mencionados.Se presenta la configuracin de la vecindad en Isatis

Es de notar que la discretizacin de bloques se hizo de 10x10x1, dado que se obtenan valores muchos ms estables de CVV al momento de ejecutar los test.Los resultados obtenidos se presentan en los siguientes histogramas y mapas.

Estimacin para Cobre Soluble

Estimacin de la ley Cobre soluble - Mapa bsico

Estimacin de la ley Cobre soluble - Histograma

Estimacin de la ley Cobre soluble Variograma

Estimacin de la ley Cobre soluble Estadsticas Bsicas

Estimacin para Cobre Total

Estimacin de la ley Cobre soluble - Mapa bsico

Estimacin de Ley de Cobre Total Histograma

Estimacin de Ley de Cobre Total Variograma

Estimacin de la ley Cobre Total Estadsticas bsicas

Conclusiones

Isatis es una herramienta bastante eficiente al momento de trabajar con variables regionalizadas, se pueden realizar una gran cantidad de anlisis univariables y multivariables.El modelamiento del variograma experimental debe ser lo mas exacto posible, pues de ello depende la mayor parte de la estimacin por kringing, la mayor parte de los datos mal estimados (varianza mayor a 2,5) ocurren por esta razn.La estimacin por kriging es bastante til al momento de estimar los recursos de un yacimiento, ya que ste es un estimador insesgado, lineal y de varianza mnima, sin embargo se debe tener cuidado ya que el kriging tiende a acercar las estimaciones a la media, disminuyendo la frecuencia de los datos extremos (que en algunos casos suele ser el de mayor inters, por ejemplo, el oro).

Bibliografa

-Emery, Xavier; Ctedras MI4040-2Anlisis estadstico y geoestadstico de datos, Semestre Primavera 2012, U-cursos, Material Docente. -Emery, Xavier; Gua y Manual ISATIS, Semestre Primavera 2012, U-cursos, Material Docente. -Emery, Xavier; Laboratorio ALGES, ALGES 1: Estudio exploratorio de datos. -Emery, Xavier; Laboratorio ALGES, ALGES 2: Variograma. -Caballero, Enrique; Memoria de ttulo,Prediccin Multivariable De Recursos Recuperables, Abril 2012.

0MI4040 Anlisis Estadstico y Geoestadstico de Datos