73
Tema 3: Análisis espacial. 4) Análisis Ráster III: Interpolación y geoestadística. Profesora titular: Daniela Ballari PhD – [email protected] Profesor ayudante: Enrique Acosta PhD – [email protected] Universidad de Cuenca

3.4

Embed Size (px)

DESCRIPTION

CLASS

Citation preview

Page 1: 3.4

Tema 3: Análisis espacial. 4) Análisis Ráster III: Interpolación y geoestadística.

Profesora titular: Daniela Ballari PhD – [email protected]

Profesor ayudante: Enrique Acosta PhD – [email protected]

Universidad de Cuenca

Page 2: 3.4

Interpolación

Cálculo de valores en puntos no muestreados, a partir de

los valores recogidos en otra serie de puntos.

≈ 10 ≈ 9

La proximidad incrementa la semejanza de valores. Es decir,

existe autocorrelación espacial para la variable interpolada.

No autocorrelación, ptos. con

valores independientes.

Distintos resultados según el

método de interpolación.

Page 3: 3.4

Clasificación métodos interpolación

Según los puntos considerados para el cálculo de valores.

● Globales: Consideran que todos los puntos de los que disponemos tienen

influencia sobre el valor a calcular en una celda.

● Locales: Sólo consideran un conjunto restringido de estos. Por umbral de

distancia (todos los situados a una distancia menor que el umbral), o por

conteo (los n puntos más cercanos), o bien ambos.

Según su valor en los puntos de partida.

● Exactos: Los valores asignados a las coordenadas correspondientes a los

puntos de origen son exactamente los recogidos en dichos puntos.

● Aproximados: El valor en esas celdas es el que corresponde al mejor ajuste,

y no ha de coincidir necesariamente con el valor original.

Según la inclusión o no de elementos probabilísticos.

● Estocásticos: Emplean elementos probabilísticos.

● Determinísticos: No los emplean.

Page 4: 3.4

a) Regular: Sitúa puntos a intervalos fijos, constituyendo lo que se conoce como una malla de muestreo.

b) Aleatorio: Azar, sin obedecer a ningún condición particular. Recomendado cuando se desconoce el comportamiento de la variable muestreada.

c) Estratificado: Requiere la presencia de una variable adicional relacionada. Si esta variable se encuentra zonificada, podemos subdividir el muestreo haciendo uso de las distintas zonas.

Tipos de muestreo

Page 5: 3.4

Métodos

Vecino más próximo

Vecino natural

Ponderado por distancia

Splines

Kriging

Page 6: 3.4

Práctica

Problema: Reproducir el ráster de precipitaciones a partir de los

puntos de muestreo y de diferentes métodos de interpolación.

Abrir GIS los archivos:- Precipitaciones mensual acumulada 2000/04 (ráster).

- Puntos de muestreo (vectorial).- Límite de Ecuador (vectorial).

Page 7: 3.4

Vecino más próximo

El valor resultante para una celda dada es sencillamente el del

punto más próximo.

Método local, exacto y determinístico.

No es adecuada para el trabajo con variables continuas, pero sí

para variables categóricas.

Page 8: 3.4

Vecino más próximo (QGIS)

Si da problemas, comprobar que

el SRC de sampling3 y del proyecto es el mismo

Page 9: 3.4

Vecino más próximo (QGIS – SAGA toolbox)

Page 10: 3.4

Imagen original del

satélite TRMM (Tropical Rainfall Measuring Mission)

Vecino más próximo (QGIS – SAGA toolbox)

Page 11: 3.4

Vecino natural

Halla el subconjunto de muestras de

entrada más cercano a un punto de

consulta y aplica ponderaciones sobre

ellas basándose en áreas propor-

cionales para interpolar un valor

(Sibson, 1981). También se conoce

como interpolación de Sibson o de "robo

de área".

Local (usa un subconjunto de muestras

alrededor de punto de consulta), exacto

y determinístico.

Genera superficies suaves.

Los vecinos naturales de cualquier

punto son aquellos asociados a los

polígonos de Voronoi (Thiessen)

cercanos. http://resources.arcgis.com/es/help/main/10.1/index.html#//005v00000027000000

Page 12: 3.4

Vecino natural

Estos polígonos (verdes) se crean al unir

los puntos entre sí, trazando las

mediatrices de los segmentos de unión.

Las intersecciones de estas mediatrices

determinan una serie de polígonos

alrededor de los puntos de control, de

manera que el perímetro de los

polígonos generados es equidistante a

los puntos vecinos y designan su área

de influencia.

A continuación, se crea un nuevo

polígono de Voronoi beige alrededor del

punto de interpolación (estrella roja). La

proporción de superposición entre este

nuevo polígono y los polígonos iniciales

se utiliza como los pesos.

http://resources.arcgis.com/es/help/main/10.1/index.html#//005v00000027000000

Page 13: 3.4

Vecino natural (QGIS - SAGA)

Page 14: 3.4

Vecino natural (QGIS - SAGA)

Imagen original del

satélite TRMM (Tropical Rainfall Measuring Mission)

Page 15: 3.4

Vecino natural (ArcGIS)

Page 16: 3.4

Vecino natural (ArcGIS)

Imagen original del

satélite TRMM (Tropical Rainfall Measuring Mission)

Page 17: 3.4

Ponderado por distancia

Local, aproximado y determinístico.

El valor en celda dada se calcula mediante una media

ponderada de los puntos de influencia seleccionados (por

distancia o por número de estos).

Sólo tienen en cuenta el alejamiento, pero no la posición.

Los métodos basados en

distancia no generan valores

que se encuentren fuera del

rango de valores de los datos

de entrada, lo cual deriva en

un «aplanamiento» de la

superficie y la aparición

de falsas terrazas (a), otros

como los splines (b) sí.

Page 18: 3.4

Ponderado por distancia (QGIS)

Page 19: 3.4

Ponderado por distancia (QGIS - SAGA toolbox)

Page 20: 3.4

Imagen original del

satélite TRMM (Tropical Rainfall Measuring Mission)

Ponderado por distancia (QGIS)

Page 21: 3.4

Ponderado por distancia (ArcGIS)

Page 22: 3.4

Ponderado por distancia (ArcGIS)

http://www.esri.com/news/arcuser/0704/files/interpolating.pdf

, Splines &

Page 23: 3.4

Imagen original del

satélite TRMM (Tropical Rainfall Measuring Mission)

Ponderado por distancia (ArcGIS)

Page 24: 3.4

Splines o curvas adaptativas

Local / global, exacto y

determinístico.

La superficie creada cumple la

condición de minimizar con

carácter global alguna propiedad

tal como la curvatura.

Pueden alcanzar valores fuera del rango definido por los

puntos de partida.

Page 25: 3.4

Splines o curvas adaptativas (QGIS)

Page 26: 3.4

Imagen original del

satélite TRMM (Tropical Rainfall Measuring Mission)

Splines o curvas adaptativas (QGIS)

Page 27: 3.4

Splines o curvas adaptativas (ArcGIS)

Page 28: 3.4

Imagen original del

satélite TRMM (Tropical Rainfall Measuring Mission)

Splines o curvas adaptativas (ArcGIS)

Page 29: 3.4

Kriging

Local / global, exacto / aproximado y estocástico.

Fuerte carga geo-estadística y existen variantes: Simple, Ordinario, Cokriging.

Requisitos:

● El error de predicción debe ser mínimo.

● Los puntos cercanos deben tener pesos mayores que los lejanos.

● La presencia de un punto cercano en una dirección dada debe restar influencia

(enmascarar) a puntos en la misma dirección pero más lejanos.

● Puntos muy cercanos con valores muy similares deben agruparse, de tal forma

que no aparezca sesgo por sobremuestreo.

http://www.esri.com/news/arcuser/0704/files/interpolating.pdf

Pueden alcanzar valores fuera del rango

definido por los puntos de partida.

● La estimación del error debe

hacerse en función de la estructura de

los puntos, no de los valores.

Page 30: 3.4

Kriging

● Autocorrelación espacial.○ Primera ley de la geografía de Tobler: “Todo está relacionado con todo, pero

las cosas más cercanas están más relacionadas que las cosas lejanas”.

○ Correlación de la variable consigo misma, de tal modo que los valores de

esta variable en un punto guardan relación directa con los de esa misma

variable en otros puntos cercanos.

○ Positiva: Los valores altos suelen tener en su entorno valores también altos.

○ Negativa: Los valores altos se rodean de valores bajos y viceversa.

+ – No Autocorrelación

Page 31: 3.4

Kriging

● Semivariograma.

○ Se fundamenta en el concepto de semivarianza:

γ(xi,xj) = 1/2(zi−zj)2

○ La semivarianza entre dos puntos es la mitad de la

diferencia al cuadrado de sus valores. Si los valores

son similares, la semivarianza será pequeña.

○ La semivarianza es una evidencia de

autocorrelación espacial.

Page 32: 3.4

Kriging

Nube de semivarianza

● Muestra una comparación entre pares de puntos en función de su distancia

geométrica.

● Desventaja: Muchos puntos, difícil de interpretar.

X = distancia entre pares de puntos

Y= semivarianza

Page 33: 3.4

Kriging

Variograma empírico

Resume la nube de semivarianza. Separa las distancias por grupos y calcula la

media de la semivarianza por grupos.

X= grupos de distancias

Y= semivarianza media

Page 34: 3.4

Kriging

Variograma empírico

Elementos básicos

● Rango: Máxima distancia hasta la cual

existe dependencia espacial. Es el valor

en el que se alcanza la máxima varianza,

o a partir del cual ya presenta una

tendencia asintótica.

● Sill: El máximo valor del variograma,

cuando los puntos se asintotizan.

Representa la máxima variabilidad en

ausencia de dependencia espacial.

● Nugget: Conforme la distancia tiende a

cero, el valor de la semivarianza tiende a

este valor. Representa una variabilidad

que no puede explicarse mediante la

estructura espacial (ruido).

Page 35: 3.4

Kriging

Variograma teórico: Ajuste del modelo

Page 36: 3.4

Kriging (SAGA)

Page 37: 3.4

Kriging (SAGA)

Page 38: 3.4

Kriging (SAGA)

Page 39: 3.4
Page 40: 3.4

Nugget = 0

Range = 300.000Sill = 9.500

Page 41: 3.4

Kriging (QGIS)

Page 42: 3.4

Kriging (QGIS)

Page 43: 3.4

Kriging (QGIS)

Imagen original del

satélite TRMM (Tropical Rainfall Measuring Mission)

Page 44: 3.4

Kriging y varianza (QGIS)

Page 45: 3.4

Original TRMM Ponderado por DistanciaPor vecinos

Splines Kriging

Resumen (QGIS)

Page 46: 3.4

Estadísticas zonales por provincias (QGIS)

Page 47: 3.4

Estadísticas zonales por provincias (QGIS)

Page 48: 3.4

Estadísticas zonales por provincias (QGIS)

Page 49: 3.4

Kriging (ArcGIS)

1

23

http://www.aguaysig.com/2011/03/geoestatistical-analyst-analisis.html

http://foro.gabrielortiz.com/comparte/repositorio/darney/Taller%20de%20Geoestadistica%20lluvias.pdf

Page 50: 3.4

Kriging (ArcGIS)

1.- Análisis exploratorio de los datos.

Page 51: 3.4

Kriging (ArcGIS)

Moda = (2,14 + 2,49) / 2 = 231,5

Coeficiente de variación (CV) = (Std. Dev / Mean) * 100)

= (94,358 / 259,72) * 100 = 36,33 %

Media, la moda y la mediana son diferentes y el coeficiente de sesgo no está comprendido entre -0,5 y + 0,5

(skewness = 0,50159), por lo tanto, no es una distribución normal y es necesario realizar una transformación logarítmica de los datos para conseguir la distribución normal.

Si CV < 100, no

hay problema con los valores extremos de los

datos.

Si 100<CV≤200, los efectos

causados por los valores extremos de los datos son

tolerables.

Si CV>200, se tiene problemas

severos con los valores extremos de los datos.

Page 52: 3.4

Kriging (ArcGIS)

Moda = (5,7 + 5,84) / 2 = 5,77

Coeficiente de variación (CV) = (Std. Dev / Mean) * 100)

= (0,36993 / 5,494) * 100 = 6,73 %

Page 53: 3.4

Kriging (ArcGIS)

Se encuentra más o menos normalizado con algunas desviaciones, pero

se nota claramente una tendencia central.

Page 54: 3.4

Kriging (ArcGIS)

Page 55: 3.4

Kriging (ArcGIS)

Es importante analizar si los

datos manifiestan tendencias

direccionales que permitan

establecer correlaciones en

esas direcciones, y formular

modelos de comportamiento.

Este gráfico 3D nos ayuda a

ver qué tendencia siguen los

datos para luego, en el análisis

estructural, indicar qué tipo de

tendencia debe ser eliminada.

Se observa una débil tendencia

tanto en el plano XZ como en

el plano YZ.

Page 56: 3.4

Kriging (ArcGIS)

Rotamos la nube de puntos y

vemos cómo cambian las

líneas de tendencias. Si éstas

siguen:

- Una línea recta

Tendencia lineal.

- Una curva con una

concavidad Tendencia

cuadrática o segundo orden.

- Una curva con más de una

concavidad Tendencia de

orden 3.

Page 57: 3.4

Kriging (ArcGIS)

Conclusión del análisis exploratorio:

- Los datos originales no seguían una distribución normal

y ha sido necesario aplicarles una transformación

logarítmica para que su distribución sea normal.

- Es necesario eliminar una tendencia de segundo orden.

Page 58: 3.4

Kriging (ArcGIS)

Conclusión del análisis exploratorio:

- Los datos originales no seguían una distribución normal

y ha sido necesario aplicarles una transformación

logarítmica para que su distribución sea normal.

- Es necesario eliminar una tendencia de segundo orden.

Page 59: 3.4

Kriging (ArcGIS)

2.- Análisis estructural de los datos y creación del modelo geoestadístico.

Page 60: 3.4

Kriging (ArcGIS)

Hemos concluido que es necesario realizar

transformación logarítmica de los datos para que

tengan distribución normal.

Hemos visto que los datos siguen una tendencia

de segundo orden.

Page 61: 3.4

Kriging (ArcGIS)

Esta ventana

permite concluir

si los datos

presentan

anisotropía

direccional o no.

Si en la gráfica

aparece un

círculo, no hay

anisotropía

direccional.

Si aparece otra cosa, como es el caso, sí existe anisotropía direccional, y

habrá que indicarlo en la ventana siguiente.

Page 62: 3.4

Kriging (ArcGIS)

Angle: Debemos cambiar el ángulo hasta que las líneas que se muestran en la figura coincidan con la

dirección de la elipse en su parte superior.

Bandwidth (lags): Una vez realizado el paso anterior, los puntos o parte inferior de las líneas deben cortar a la elipse, para ello se aumenta o disminuye el valor de Bandwidth.

Cuidado, puede ser que si dejamos «semivariograma» no veamos la elipse de la anisotropía.

Page 63: 3.4

Kriging (ArcGIS) Modelo esférico

Page 64: 3.4

Kriging (ArcGIS)

- Recálculo de los datos en comparación con los valores medidos para verificar.

- Predicción de los errores.

- Un gráfico de comparación de datos medidos y datos calculados. Los datos que más se

alejan de la línea, son los que mayores errores presentan en su predicción.

Obtenemos:

Modelo esférico

Page 65: 3.4

Kriging (ArcGIS)

Resumen del

modelo esférico.

Page 66: 3.4

Kriging (ArcGIS)

Modelo esférico

Page 67: 3.4

Kriging (ArcGIS)

3.- Mapa de errores

Modelo esférico

Page 68: 3.4

Kriging (ArcGIS)

El máximo error (dentro de Ecuador) oscila entre 85 y 138 %, muy alto. La

confiabilidad del modelo se calcula como 100 menos el error máximo, es decir, 100

- 138 = - 38 %. Para que un modelo geoestadístico sea aceptable, debe tener una

confiabilidad superior al 90%, por lo tanto se concluye que es necesario mejorar la

densidad de las estaciones meteorológicas. Los errores mayores en la predicción se producen donde existe menos información.

Modelo esférico

Page 69: 3.4

Kriging (ArcGIS)

Para seleccionar el modelo que crea la

mejor superficie interpolada, es necesario

aplicar cada uno de ellos y escoger el que

presente:

- Menor Root-Mean-Square.

- Menor Average Standard Error.

- Root-Mean-Square Standardized más

cercano a uno.

- Mayor porcentaje de confiabilidad.

MODELO ESFÉRICO

Parámetro Valor

Root-Mean-Square 56,96

Average Standard Error 59,68

Root-Mean-Square Standardized 0,97

Confiabilidad -38 %

Paso 4 de 6

Paso 6 de 6

Page 70: 3.4

Kriging (ArcGIS) Modelo exponencial

Page 71: 3.4

Kriging (ArcGIS)

Mod. esférico

Modelo exponencial

Page 72: 3.4

Kriging (ArcGIS)

Modelo exponencial

El máximo error (dentro de Ecuador) oscila entre 106 y 161 %, muy alto. La

confiabilidad del modelo sería 100 - 161 = - 61 % (peor resultado que el modelo esférico, -38 %).

Page 73: 3.4

Elección del método de interpolación.

● Las características de la variable a interpolar. a. Valores de precipitación máxima anual, no es adecuado utilizar aquellos métodos que

suavicen excesivamente la superficie resultante, ya que se estarían perdiendo los valores

extremos que, por la naturaleza del valor interpolado, son de gran interés.

● Las características de la superficie a interpolar. a. Variaciones bruscas en puntos de discontinuidad tales como acantilados en el caso de

interpolar elevaciones, son aplicables mediante la imposición de barreras con métodos

como el de distancia inversa, pero no con otros como el kriging.

● La calidad de los datos de partida. a. Los datos de partida son de gran precisión → los métodos exactos porque preservan la

información original.

b. Datos de partida contienen mucho ruido → Kriging que suavizan el resultado y el efecto

de ruido es preferible.

● El rendimiento de los algoritmos. a. Basados en distancia son rápidos y requieren un tiempo de proceso aceptable.

b. Kriging es más complejo y el tiempo de proceso es elevado.

● El conocimiento de los métodos.