Upload
marcelo-hernandez-nauto
View
213
Download
0
Embed Size (px)
Citation preview
8/12/2019 Funcionamiento_MAXENT
1/41
Funcionamiento,interfaz y
formato de los datos en
MaxEnt
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Elisa Liras
Dpto. Biologa Vegetal y Ecologa
Universidad de Almera
Grupo de investigacin Ecologa de Zonas ridas
CENTRO ANDALUZ PARA LA EVALUACIN YSEGUIMIENTO DEL CAMBIO GLOBAL
8/12/2019 Funcionamiento_MAXENT
2/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Qu es MaxEnt?
MaxEnt, un programa basado en una distribucin de Mxima Entropa para lamodelizacin de la distribucin geogrfica de las especies.
Ha sido escrito originalmente por Steven Phillips, Miro Dudik y Rob Schapire, con el
respaldo de AT&T Labs-Research, Princeton University, y e Centro para laBiodiversidad y Conservacin, Museo de Historia Natural de Amrica.
Y qu hace?
MaxEnt empieza ajustando los datos a partir de una distribucin unifome, que vamodificando hasta una distribucin de Mxima Entropa. El modelo se basa en
ajustar los parmetros de la distribucin final.
Qu necesitamos?
1) conjunto de localidades (puntos) donde se sabe que la especie est
presente
2) coberturas geogrficas parmetros ambientales que pueden,
potencialmente, limitar la capacidad de supervivencia de la especie.
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
3/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Qu significa Mxima Entropa?
Entropa = cantidad de informacin contenida por un sistema
Mxima entropa = distribucin ms extendida, cercana a uniforme
Entonces
El mtodo de Mxima Entropa: para estimar una distribucin desconocida:
Determinar lo que se conoce (restricciones)
Entre las predicciones que se ajustan a las restricciones se favorece la que tiene
mxima entropa
Las restricciones estn impuestas por los valores de las variables ambientales en
las localidades conocidas de la especie.
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
4/41
??
Media
muestral
Regin de confianza
(m.muestral # m.poblacional)
Distribucin resultado
(modelo)
Variables ambientales
determinan cundo hay un
pico
muestra
Podemos estimar este
punto?
Valor Precipitacin a los queaparece la especie
Frecuencia
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
5/41Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Steven Phillips, Miro Dudik & Rob Schapire
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
6/41Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Steven Phillips, Miro Dudik & Rob Schapire
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
7/41Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Modelos de nicho:
$T$T
$T
$T
$T
$T$T
$T
$T$T
$T$T
$T
$T
$T
$T
$T$T$T$T
$T
$T
$T
$T
$T
$T
$T$T$T
$T$T
$T
$T
$T$T
$T$T
$T
$T
$T
$T
$T
$T
$T
$T
$T
$T
$T$T
$T
$T
$T$T$T$T
$T
$T
$T
$T
$T$T
$T$T
$T$T
$T
$T$T
$T
$T$T
$T
$T
$T
$T
$T
$T
$T
$T
$T
$T
$T$T
$T
$T
$T$T
$T$T
$T$T
$T$T$T$T
$T$T
$T
$T
$T
$T$T
$T
$T$T
$T$T
$T
$T
$T
$T
$T$T$T$T
$T
$T
$T
$T
$T
$T
$T$T$T
$T$T
$T
$T
$T$T
$T$T
$T
$T
$T
$T
$T
$T
$T
$T
$T
$T
$T$T
$T
$T
$T$T$T$T
$T
$T
$T
$T
$T$T
$T$T
$T$T
$T
$T$T
$T
$T$T
$T
$T
$T
$T
$T
$T
$T
$T
$T
$T
$T$T
$T
$T
$T$T
$T$T
$T$T
$T$T$T$T
Es
pacioGeog
rfico
Registros de presencia
de una especie
Temperatura
Humedad
Modelo de Nicho Ecolgico
Prediccin de distribucin
Producto
EspacioEcolgico
Informacin
Ambiental
Proyeccin de vuelta al
espacio geogrfico
Pend
iente
Datos de entrada
Algoritmo de
Modelado
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
13 F i i t i t f f t d l d t M E t
8/12/2019 Funcionamiento_MAXENT
8/41Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Bradypus variegates
Superficie de
probabilidad
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
13 F i i t i t f f t d l d t M E t
8/12/2019 Funcionamiento_MAXENT
9/41Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Ventajas de MaxEnt:
Datos ambientales continuos y categricos (trabaja con la frecuencia de aparcin)
Resultado continuo
Comportamiento determinista (repetible)
Capacidad interpretativa en dimensiones ecolgicas (curvas de respuesta)
Rpido
Exacto (se ajusta a los datos)
Steven Phillips, Miro Dudik & Rob Schapire
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
13 F ncionamiento interfa formato de los datos en Ma Ent
8/12/2019 Funcionamiento_MAXENT
10/41Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
13 Funcionamiento interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
11/41Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
13 Funcionamiento interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
12/41Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Archivo .csv
species,longitude,latitude
bradypus_variegatus,-65.4,-10.3833
bradypus_variegatus,-65.3833,-10.3833
bradypus_variegatus,-65.1333,-16.8
bradypus_variegatus,-63.6667,-17.45
bradypus_variegatus,-63.85,-17.4
Opcin: Settings Delete duplicates.
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
Especificar archivo de datos
Si hubiera ms de una especie, lo
veramos aqu
(se pueden seleccionar o no,
dependiendo de si queremosincluirlas en el modelo)
13 Funcionamiento interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
13/41Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
13 Funcionamiento interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
14/41Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Formato de coberturas:
ASCII grid de ESRI
Hay que especificar si la
variable es continua o
categrica!!
Variables categricas:
indicadas preferiblemente por
nmeros (mejor que por letras o
palabras).
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
(las coberturas se pueden
seleccionar o no, dependiendo de si
queremos incluirlas en el modelo)
Especificar archivo de datos
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
15/41
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
16/41
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Especificar archivo de salida
Especificar archivo con las
coberturas de proyeccin
Hay 3 tipos de
formato deresultados
(diferencias ms
adelante)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
17/41
, y
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
18/41
y
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
El gain est relacionado con la desviacin, una medida de la bondad de ajuste utilizada
en GAM y GLM.
Esta medida empieza en el valor 0 y va aumentando asintticamente durante el proceso
de modelizacin.
Durante este proceso, MaxEnt est generando una distribucin de probabilidad sobre
los pxeles de la grid, empezando por una distribucin uniforme y, de forma iterativa,
mejorando el ajuste de la distribucin a los datos de muestreo.
Al final del proceso, el valor del gain indica cmo de ajustado est el modelo a las
muestras de presencia; por ejemplo, si el gain toma valor de 2, ello significa que el valormedio de los pxeles que contienen un punto de presencia es exp(2) 7.4 veces mayor
que una distribucin al azar sobre dicho pxel.
Ntese que MaxEnt no est calculando directamente la probabilidad de ocurrencia. La
probabilidad asignada por el modelo a cada pxel es, generalmente, muy pequea, dadoque la suma de los valores totales del grid debe de ser 1
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
19/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Archivos de salida (resultado de MaxEnt): html
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
20/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
21/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Logistico:
Valor por defecto
Da una estimacin entre 0
y 1 de la probabilidad depresencia
Es el ms fcil de
interpretar
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
22/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Datos crudos (raw data):
Es simplemente el modelo
exponencial de MaxEnt
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
23/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Cumulativo:
Es el resultado ms fcil
de interpretar en trminosde tasa de prediccin de
omisin
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
24/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
25/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
% de datos que se
guardan para
realizar el test
Eliminar puntos duplicados
Archivo de datos
independientescon los que
realizar el test
Ajuste delmodelo (menor
1: ms ajustado)
Sin seleccionar: MaxEnt utiliza
un conjuto de datos fijo
N mximo de iteraciones
Lmite de convergencia
N mximo de background
puntos (grid)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
26/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
% de datos que se
guardan para
realizar el test
Eliminar puntos duplicados
Archivo de datos
independientescon los que
realizar el test
Ajuste delmodelo (menor
1: ms ajustado)
Sin seleccionar: MaxEnt utiliza
un conjuto de datos fijo
N mximo de iteraciones
Lmite de convergencia
N mximo de background
puntos (grid)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
27/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Grfico 1: Muestra cmo las omisiones calculadas a partir de los puntos de
entrenamiento y los de test, y el rea predicha como favorable varan segn el valorlmite cumulativo:
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
28/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Grfico 2: Curva operacional (curva ROC), para los 2 grupos de datos, el de test y el de
entrenamiento, as como el rea por debajo de la curva ROC (AUC).
La curva roja (entrenamiento) representa el ajuste del modelo a los datos demuestreo. La curva azul (test) indica el grado de ajuste del modelo a los datos de test, y
supone el test real del poder predictivo del modelo. La lnea turquesa representa la lnea
esperada si el modelo no fuese mejor que por azar. Si la curva azul (test) cae por debajo
de la lnea turquesa, indica que el modelo es peor que si se hubiese hecho al azar. Por el
contrario, cuanto ms se aproxime la curva azul a la esquina superior izquierda, mejor es elmodelo para predecir las presencias de los datos de test.
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
29/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Si hay disponible un subconjunto de datos para el test, el programa calcula
automticamente la significancia estadstica de la prediccin utilizando un testbinomial de omisin.
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
30/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Qu variables importan ms?
El programa asigna el incremento en el gain a las variables ambientales de las que
depende la especie. Convirtiendo dichos valores a porcentajes, al final del proceso de
modelado obtenemos la siguiente tabla:
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
31/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
32/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Qu variables importan ms?
En cada vuelta del modelo se excluye una variable y se crea el modelo con las
variables remanentes. Despus, se crea un modelo con cada una de las variables porseparado. De forma adicional, se crea un modelo utilizando todas las variables, como
en el caso normal de ejecutar MaxEnt.
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
33/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
34/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
C d d l di i d l i bl ?
8/12/2019 Funcionamiento_MAXENT
35/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Cmo depende la prediccin de las variables?
Curvas de respuesta: se evala cada variables manteniendo el valor del resto fijo en
su valor medio (cuidado con variables correlacionadas!!!)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
C d d l di i d l i bl ?
8/12/2019 Funcionamiento_MAXENT
36/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Cmo depende la prediccin de las variables?
Contribucin marginal de cada variable por s sola al modelo (obviando el resto de
variables)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
37/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
38/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Si ponemos un valor ms
pequeo: modelo menos
ajustadoCuidado: distintos valores
pueden dar lugar a modelos
demasiado generales o modelos
sobre-ajustados
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
Regularizacin: modelo ms general (valor de regularizacin menor que 1)
8/12/2019 Funcionamiento_MAXENT
39/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Regularizacin: modelo ms general (valor de regularizacin menor que 1)
originalregularizado
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
40/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Para quien tenga un poco de experiencia en programacin
1) Cuando las grids ambientales son muy grandes se puede utilizar el
formato de datos SWD (samples with data)
2) La modelizacin puede automatizarse con comandos de lnea
(BATCH RUNNING) cuando se necesitan generar muchos modeloscambiando los parmetros
3) Los resultado de MaxEnt se pueden importar en otros softwares
estadsticos para realizar anlisis adicionales (ejemplo: paquetes
ROCR, vcd y boot de R)
Todo esto est explicado en el manual
13. Funcionamiento, interfaz y formato de los datos en MaxEnt
8/12/2019 Funcionamiento_MAXENT
41/41
Rplica del IV taller de modelizacin de nichos ecolgicos (27-30 Mayo 2008)
Muchas gracias