5
Memoria científica del proyecto FB-CACC2017 Con el apoyo de 1 INFORME SOBRE LA OBTENCIÓN Y ANÁLISIS DE IMÁGENES TOMADAS POR SATÉLITE Y LA TELEDETECCIÓN AUTOMÁTICA DE ELEMENTOS DEL PAISAJE Sergio Baamonde Álvarez, Manuel González Penedo & Jorge Novo Buján Objetivo En esta sección, se ha desarrollado un sistema de clasificación multi-temporal para identificar y representar las diferentes clases de usos del suelo de interés asociados con el proyecto. En concreto, tras diversos análisis se han definido cinco categorías de hábitat que se han considerado como las más importantes para determinar la potencial distribución de las especies analizadas así como otras especies amenazadas que puedan ser de interés en el futuro: eucaliptal, bosque autóctono, matorral, campos de cultivo e infraestructuras. En este caso, el bosque nativo es el hábitat más usado por las especies analizadas y está localizado principalmente en las riveras de los ríos Mandeo y Mendo. Las plantaciones de eucalipto representan una de las principales amenazas para la conservación de las especies estudiadas en este área. Una faceta a destacar es la enorme heterogeneidad y variabilidad de los tipos de suelo analizados, con variaciones particulares y visualizaciones diferentes en cada caso a lo largo del año natural, particular de cada uno de los tipos. Para su identificación, se ha diseñado para poder utilizar sobre cualquier período del año usando datos de imagen del satélite Sentinel-2. De esta forma, se consigue generar una capa ráster con la información del tipo de terreno del área a estudiar, que servirá como dato de entrada en el proceso de generación del modelo predictivo de poblaciones. Metodología Tal y como muestra el esquema, la metodología para el sistema desarrollado se ha dividido en 3 bloques de tareas principales: generación del conjunto de datos, entrenamiento del modelo de clasificación de los tipos de uso del suelo y validación de dicho modelo obtenido. Generación del conjunto de datos En primer lugar, y tras un análisis de fuentes de información de utilidad, se ha utilizado la base de datos Copernicus Open Access Hub (CopHub), sobre la cual se realiza una

INFORME SOBRE LA OBTENCIÓN Y ANÁLISIS DE IMÁGENES …

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Memoria científica del proyecto FB-CACC2017

Conelapoyode

1

INFORME SOBRE LA OBTENCIÓN Y ANÁLISIS DE IMÁGENES TOMADAS POR SATÉLITE Y LA TELEDETECCIÓN AUTOMÁTICA DE ELEMENTOS DEL PAISAJE

Sergio Baamonde Álvarez, Manuel González Penedo & Jorge Novo Buján

Objetivo

En esta sección, se ha desarrollado un sistema de clasificación multi-temporal para identificar y representar las diferentes clases de usos del suelo de interés asociados con el proyecto. En concreto, tras diversos análisis se han definido cinco categorías de hábitat que se han considerado como las más importantes para determinar la potencial distribución de las especies analizadas así como otras especies amenazadas que puedan ser de interés en el futuro: eucaliptal, bosque autóctono, matorral, campos de cultivo e infraestructuras.

En este caso, el bosque nativo es el hábitat más usado por las especies analizadas y está localizado principalmente en las riveras de los ríos Mandeo y Mendo. Las plantaciones de eucalipto representan una de las principales amenazas para la conservación de las especies estudiadas en este área. Una faceta a destacar es la enorme heterogeneidad y variabilidad de los tipos de suelo analizados, con variaciones particulares y visualizaciones diferentes en cada caso a lo largo del año natural, particular de cada uno de los tipos.

Para su identificación, se ha diseñado para poder utilizar sobre cualquier período del año usando datos de imagen del satélite Sentinel-2. De esta forma, se consigue generar una capa ráster con la información del tipo de terreno del área a estudiar, que servirá como dato de entrada en el proceso de generación del modelo predictivo de poblaciones.

Metodología

Tal y como muestra el esquema, la metodología para el sistema desarrollado se ha dividido en 3 bloques de tareas principales: generación del conjunto de datos, entrenamiento del modelo de clasificación de los tipos de uso del suelo y validación de dicho modelo obtenido.

Generación del conjunto de datos

En primer lugar, y tras un análisis de fuentes de información de utilidad, se ha utilizado la base de datos Copernicus Open Access Hub (CopHub), sobre la cual se realiza una

Memoria científica del proyecto FB-CACC2017

Conelapoyode

2

búsqueda secuencial de la información para todos los meses del año a estudiar. Esta búsqueda está acotada para obtener paquetes de datos que contengan información del área de estudio del proyecto, la ZEC Betanzos-Mandeo.

A continuación, el sistema realiza una serie de tareas de filtrado de los paquetes de datos obtenidos para mejorar la calidad de la información a nuestra disposición: se seleccionan los productos de Sentinel-2 con cobertura de nubes igual o inferior al 25%, con fecha de producto más temprana en cada mes y se realiza una comprobación adicional para comprobar que el área del producto cubra en su totalidad a la región de estudio. A continuación, se pueden comprobar algunos de los principales productos analizados:

Con los productos seleccionados, se extraen las capas de 10 metros de resolución: rojo, verde, azul (a) e infrarrojo cercano. Estas bandas se usan para calcular el Índice de Vegetación de Diferencia Normalizada (IVDN) que representa la diferencia entre la reflectividad de la banda de infrarrojo cercano y la banda roja del espectro visible y que sirve para identificar diferencias fenológicas entre tipos de vegetación (b). Finalmente, acotamos todos los resultados a la región de estudio (c) y comprobamos si hay puntos que se solapen con la máscara de nubes (d). De esa manera nos aseguramos de disponer de información representativa sobre el tipo de suelo analizado para realizar una clasificación e identificación fiable.

Entrenamiento del modelo

Una vez disponemos de los conjuntos de datos preparados, siendo representativos de los diferentes tipos de usos de suelo a analizar en el proyecto, se han utilizado varios clasificadores de referencia: Random Forest, Máquina de Soporte Vectorial Radial y k-vecinos más cercanos.

Los datos de entrada para estos clasificadores están compuestos de los valores de las capas de 10m de resolución así como del índice IVDN. Estos valores han sido muestreados en base a un total de 526 puntos obtenidos in situ representativos del terreno del área de interés, obteniendo un total de 6038 muestras a lo largo de los 12 meses del año de estudio. Si bien el máximo número de muestras posibles sería de 6312, los puntos que se solapan con áreas cubiertas por la máscara de nubes son ignorados para evitar errores en la clasificación. Se utilizan 4229 muestras para entrenar el modelo de clasificación, mientras que las 1809 muestras restantes se utilizan para validar dicho modelo.

Memoria científica del proyecto FB-CACC2017

Conelapoyode

3

Resultados

Se ha conseguido generar un modelo que identifica automáticamente las diferentes clases de usos de suelo en el área de interés ZEC Betanzos-Mandeo usando datos de imagen de la constelación de satélites Sentinel-2. Las diferentes pruebas proporcionaron unos resultados satisfactorios. En concreto, usando la mejor configuración de clasificadores (Máquina de Soporte Vectorial Radial) se consigue una precisión de clasificación de 84.0% con un valor kappa de 79.9%. Los otros clasificadores también proporcionaron resultados satisfactorios (precisiones de 82.7% y 79.6% para el Random Forest y k-vecinos más cercanos, respectivamente) aunque con valores ligeramente inferiores. En todo caso, dicha estabilidad de resultados adecuados corrobora la idoneidad del esquema de sistema de análisis y clasificación planteado. A continuación podemos visualizar la matriz de confusión obtenida usando el clasificador ganador con las clases de suelo estudiadas:

En éste, y los clasificadores alternativos estudiados, la clase matorral proporcionó unos resultados inferiores a las otras clases, parcialmente causado por la dificultad de diferenciación desde una vista aérea general de los propios matorrales con respecto a otras estructuras arbóreas. Por otra banda, la clase infraestructura presentó los mejores resultados, comportamiento que también es muy estable en todos los clasificadores analizados. En este caso, la variabilidad de las propias estructuras es reducida, siendo más claramente diferenciables de estructuras y suelos de cultivo y arbóreos y que presentan una estabilidad clara a lo largo de todo el año natural.

A continuación se puede visualizar un resultado de predicción sobre un conjunto de datos mensual de Sentinel-2, mostrado en primer lugar. Los resultados se obtienen en forma de raster que son empleados para generar los modelos predictivos de poblaciones:

Memoria científica del proyecto FB-CACC2017

Conelapoyode

4

Memoria científica del proyecto FB-CACC2017

Conelapoyode

5

Como podemos comprobar, el sistema es capaz de identificar estructuras y puntos de referencia representativos, como granjas o bosques. En particular, podemos comprobar como el mapa utiliza un código de colores para representar la clasificación de cada punto a una de las clases estudiadas, en una visualización clara e intuitiva para la posterior inspección del usuario. Combinando finalmente la imagen original con la clasificada ilustramos mejor la similitud entre la clasificación y el terreno incluido en la imagen original.