SIG con R

Evapotranspiración Potencial e Índice Estandarizado de Precipitación a Nivel Espacial

julio 15, 2023

Introducción: El estudio del clima y sus patrones es fundamental para comprender los fenómenos atmosféricos y sus implicaciones en diversas áreas, como la agricultura, la gestión del agua y la planificación urbana. Dos variables climáticas clave son la Evapotranspiración Potencial (ETP) y el Índice Estandarizado de Evapotranspiración (SPEI).

Evapotranspiración Potencial (ETP): La Evapotranspiración Potencial es una medida que estima la cantidad de agua que se evapora y transpira en una determinada área bajo condiciones climáticas ideales. En otras palabras, representa la cantidad de agua que una planta necesitaría para crecer adecuadamente si se tuvieran en cuenta factores como la temperatura, la humedad y la radiación solar. La ETP es una variable fundamental en la agricultura, ya que nos ayuda a determinar los requerimientos hídricos de los cultivos y planificar su riego de manera eficiente.

El Standardised Precipitation-Evapotranspiration Index (Índice Estandarizado de Precipitación-Evapotranspiración, SPEI por sus siglas en inglés) es una medida que combina la información sobre la precipitación y la evapotranspiración para evaluar las condiciones de humedad en un área determinada. Permite cuantificar si una región está experimentando períodos de sequía o humedad inusual en relación con su historial climático.

El SPEI se basa en el concepto de balance hídrico, que considera tanto la cantidad de agua que ingresa al sistema a través de la precipitación como la cantidad de agua que sale del sistema debido a la evaporación y la transpiración de las plantas. Al combinar estos dos factores, el SPEI proporciona una medida estandarizada de las condiciones de humedad que permite comparar y analizar los datos en diferentes escalas de tiempo y regiones.

El índice estándar se calcula normalizando los datos de precipitación y evapotranspiración en relación con su distribución histórica. Esto significa que se ajustan los valores para que estén en una escala común, lo que facilita la comparación y la identificación de patrones de sequía o humedad anormal.

El SPEI se expresa en valores positivos y negativos. Valores positivos indican condiciones de humedad por encima del promedio histórico, mientras que valores negativos indican condiciones de sequía. Cuanto mayor es el valor absoluto (positivo o negativo), mayor es la desviación de las condiciones normales.

Este índice es una herramienta útil en la gestión del agua, la agricultura y la planificación de recursos hídricos, ya que permite monitorear y evaluar las condiciones de humedad en una región específica. Proporciona información valiosa para la toma de decisiones y la implementación de medidas de mitigación en respuesta a eventos de sequía o cambios en los patrones de precipitación y evapotranspiración.

Aquí tienes un vídeo tutorial en el cual calculamos las dos variables mencionadas a partir del uso de información climática (que está disponible a nivel mundial) y el uso del lenguaje de programación de R.

¡Nos vemos en YouTube!

Si requieres asesoría escríbeme al Whatsapp:
Pre-procesamientos modelos de nicho ecológico

julio 5, 2023
Aquí, grosso modo, los pasos a seguir para la modelación de distribución de especies / nicho ecológico con el uso de herramientas de Sistemas de Información Geográfica.

Sabemos que los datos a requerir:

Preparación de datos para la modelación
1. (50%) Datos climáticos que den cuenta de la presencia u ausencia de la especie, variables como precipitación, temperatura, y de ser el caso, evapotranspiración potencial (por ejemplo, la del método de Hargreaves modificado). Dentro de este paso se requieren hacer varios sub-pasos, entre los que se encuentran.
  - Descarga de datos climáticos recientes con el apoyo de Terraclimate (precipitación, temperatura máxima y mínima), la resolución de estos es de 5 km. Aquí nos podemos apoyar en la librería climateR de R.
  - Corte para el área de estudio, ejemplo, el área del departamento del Valle del Cauca, datos de municipios se consiguen con el Instituto Geográfico Agustín Codazzi dentro de Colombia.
  - Descarga de datos de altitud (metros sobre el nivel del mar), a una resolución fina, ejemplo, 90 metros, esto será de mucha utilidad para el manejo de áreas de estudio pequeñas, como lo son los municipios o distritos. Para esto se puede hacer uso de la librería elevatr de R.
  - Con el apoyo de técnicas como Geographically Weigthed Regression podremos realizar desescalado de la información climática de línea base, aquí usaríamos las variables climáticas en bruto y luego las altitud como una co-variable, por ejemplo, sabemos que a mayor altitud hay una menor temperatura, esto nos sirve como premisa para obtener los datos climáticos a resolución de 90 metros. Las librerías a utilizar aquí, pueden ser: RSAGA o spatialEco.
  - Como los datos que hemos descargado están a resolución temporal multi-mensual deberíamos realizar una agregación a nivel mensual, es decir, tener un promedio de todos los eneros, febreros…, hasta diciembre.
  - Una vez con los datos climáticos mensuales procedemos a realizar la estimación de las variables bioclimáticas, las cuales dan cuenta del comportamiento de la precipitación y temperatura a lo largo de un año, aquí el listado. Decir además, que según sea la necesidad, también podremos calcular las variables bioclimáticas para la evapotranspiración potencial.
  - Ya con esto, podremos hacer un análisis climático de la región objeto de estudio creando tanto gráficos como mapas que ilustren el comportamiento.
  - A estos datos de línea base se les puede agregar el uso de información climática proyectada del último informe del Panel Intergubernamental de Cambio Climático (IPCC), esto con la finalidad de identificar, ok a futuro, donde se podría dar la idoneidad para la especie que estoy modelando, y de esta menara desarrollar planeación prospectiva en la búsqueda de conservar la especie y/o mitigar el impacto del cambio climático sobre la misma. Aquí podríamos descargar los datos de los GCM del SSP 245 y SSP 585, disponibles aquí, o también con el apoyo de la librería base de R y geodata.
2. (30%) Datos de presencias de las especies objeto de estudio. Aquí se requieren coordenadas geográficas, ojalá, en WGS 1984 (sistema de coordenadas) de lugares donde conozcamos que hay presencia de la especie, ejemplo, puntos de fincas donde hay el cultivo de café, aquí el dato puede ser tanto en tabla (x & y) como en shapefile. Este levantamiento de puntos se puede hacer con el apoyo de interpretación de imágenes de satélite, por ejemplo, Landsat 7-8, o en su defecto, con el uso de Google Earth Pro y Google Street View.
3. (20%) Datos de pseudo-ausencias, estos son coordenadas geográficas de lugares distintos a donde se encuentran las presencias, que haríamos aquí: generamos un buffer alrededor de las presencias de la distancia que consideremos razonable, y de forma aleatoría ubicamos puntos en lugares distintos a estas áreas de buffer, a esto se le conoce como background (en inglés) o pseudo-ausencias; y dentro de la modelación funciona para identificar el comportamiento climático de las áreas donde no sabemos si se encuentra la especie.
Para más información, invito a leer estos artículos científicos:

Spatial distribution of dry forest orchids in the Cauca River Valley and Dagua Canyon: Towards a conservation strategy to climate change J Reina-Rodriguez, Guillermo. Rubiano, Jorge. Castro, Fabio. Tupac. Journal For Nature Conservation 30, 32-43

Orchid distribution and bioclimatic niches as a strategy to climate change in areas of tropical dry forest in Colombia GA Reina-Rodríguez, JER Mejía, FAC Llanos, I Soriano. Lankesteriana International Journal on Orchidology 17 (1), 17-47

Climate change favors rice production at higher elevations in Colombia F Castro-Llanos, G Hyman, J Rubiano, J Ramirez-Villegas, H Achicanoy. Mitigation and Adaptation Strategies for Global Change 24, 1401-1430

Yield gap analysis to identify attainable milk and meat productivities and the potential for greenhouse gas emissions mitigation in cattle systems of Colombia R González-Quintero, MT van Wijk, A Ruden, M Gómez, H Pantevez, … Agricultural Systems 195, 103303
Estadística espacial – Geoestadística

junio 22, 2023
Interpolación

En esta blog hablaremos sobre la estadística espacial, propiamente en las interpolaciones espaciales, explorando tres métodos ampliamente utilizados: IDW, Kriging y Cokriging. A medida que avancemos, explicaremos en qué consiste cada uno de ellos y proporcionaremos ejemplos ilustrativos para facilitar la comprensión.

La interpolación espacial es una técnica utilizada para estimar valores desconocidos en lugares no muestreados dentro de un área geográfica. Esta técnica es ampliamente aplicada en diferentes campos, como la climatología, la hidrología, la agricultura y muchas otras disciplinas relacionadas con la geografía.
- Interpolación IDW (Inverse Distance Weighting): El método de Interpolación IDW se basa en la suposición de que los puntos más cercanos a un lugar desconocido tienen una mayor influencia en su valor que los puntos más alejados. La interpolación IDW calcula los valores desconocidos ponderando inversamente la distancia entre los puntos de muestra y el lugar desconocido. Es decir, los puntos cercanos tienen un mayor peso en la estimación que los puntos más lejanos. Ejemplo: Supongamos que tenemos datos de temperatura en una región y queremos estimar la temperatura en un lugar no muestreado. Aplicando IDW, los valores de temperatura más cercanos tendrán un mayor peso en la estimación que los valores más alejados.
- Kriging: El método de Kriging es una técnica más sofisticada que tiene en cuenta la correlación espacial de los puntos de muestra. A diferencia de IDW, Kriging considera tanto la influencia de los puntos cercanos como su estructura espacial global. Este método utiliza un modelo estadístico para describir la variación espacial y utiliza una técnica llamada semivariograma para cuantificar la relación espacial entre los puntos de muestra. Ejemplo: Supongamos que tenemos datos de contaminación del aire en diferentes estaciones de monitoreo y queremos estimar la contaminación en una ubicación sin datos. Utilizando Kriging, podemos considerar tanto la proximidad de las estaciones de monitoreo como la estructura de correlación espacial entre ellas para obtener una estimación más precisa.
- Cokriging: El Cokriging es una técnica avanzada que aprovecha la relación espacial entre dos o más variables para mejorar las estimaciones. Este método se utiliza cuando se dispone de una variable principal y una o más variables secundarias que están espacialmente correlacionadas. El Cokriging utiliza la información de las variables secundarias para mejorar la precisión de las estimaciones de la variable principal. Ejemplo: Supongamos que queremos estimar el rendimiento de los cultivos en una región utilizando datos de precipitación y temperatura como variables secundarias. El Cokriging aprovecha la correlación espacial entre la precipitación, la temperatura y el rendimiento de los cultivos para mejorar las estimaciones en áreas sin datos.
Es importante tener en cuenta que la elección del método de interpolación dependerá de las características de los datos y los objetivos del estudio. Al comprender estos métodos y sus aplicaciones, podrás seleccionar el enfoque más adecuado para tus propias necesidades en el ámbito de la estadística espacial.

Ahora bien, he realizado un vídeo tutorial ilustrativo donde explicamos estas tres técnicas a partir de datos de estaciones climáticas de Guatemala para la temperatura.

Sí deseas asesoría personalizada me puedes contactar a mi Whatsapp:
Cálculo de distancia euclideana con R – Índice de accesibilidad

mayo 23, 2023

En este tutorial realizamos el siguiente mapa, el cual corresponde a la distancia euclideana de la red vial del Norte del Valle del Cauca, en otras palabras, es un proxy del índice de accesibilidad.

El tutorial está en mi canal de YouTube, aquí:

Sí deseas replicar este ejercicio y aprender de la mano conmigo puedes descargar los datos y códigos aquí.

https://github.com/fabiolexcastro/tutorials_youtube/tree/master/accesibility

Sí deseas asesoría personalizada me puedes contactar por medio de Whatsapp
Distribución de gumbel para mapas de retorno de precipitación – Ejercicio práctico con R

mayo 1, 2023
La distribución estadística de Gumbel, también conocida como distribución de tipo I de valores extremos, es un modelo matemático utilizado en estadística para describir la distribución de los valores extremos en un conjunto de datos. Fue propuesta por el estadístico británico Emil Julius Gumbel en la década de 1950.

La distribución de Gumbel es especialmente adecuada para modelar eventos extremos, como las máximas o mínimas históricas en una serie de datos. Es comúnmente utilizada en el análisis de riesgo hidrológico y en la estimación de tasas de retorno de fenómenos como precipitación intensa, caudales máximos de ríos, vientos extremos, entre otros.

Para aplicar la distribución de Gumbel en la obtención de mapas de tasas de retorno de precipitación a diferentes escalas de tiempo, se sigue un procedimiento general que consta de los siguientes pasos:
1. Recopilación de datos: Se recopilan registros históricos de precipitación en diferentes ubicaciones dentro de la región de interés. Cuantos más datos se tengan, mejor será la estimación.
2. Ajuste de la distribución: Se realiza un ajuste estadístico de los datos observados a la distribución de Gumbel. Esto implica encontrar los parámetros de la distribución que mejor se ajusten a los datos, utilizando métodos estadísticos como el método de máxima verosimilitud.
3. Estimación de la tasa de retorno: Una vez que se ha ajustado la distribución de Gumbel, se puede utilizar para estimar la tasa de retorno de diferentes eventos extremos de precipitación. La tasa de retorno se define como la probabilidad de que un evento igual o mayor al umbral dado ocurra en un período de tiempo determinado. Por ejemplo, la tasa de retorno de 100 años para un evento de precipitación sería la probabilidad de que dicho evento ocurra o se supere en promedio una vez cada 100 años.
4. Generación de mapas de tasas de retorno: Utilizando los parámetros estimados de la distribución de Gumbel y considerando la variabilidad espacial de la precipitación, se pueden generar mapas de tasas de retorno de precipitación para diferentes períodos de retorno. Estos mapas proporcionan información sobre la probabilidad de ocurrencia de eventos extremos de precipitación en diferentes áreas de la región.
Es importante tener en cuenta que el uso de la distribución de Gumbel y la generación de mapas de tasas de retorno de precipitación están sujetos a incertidumbres y limitaciones inherentes a los datos y al modelo estadístico utilizado. Además, es crucial considerar que el cambio climático puede alterar las características de las precipitaciones extremas y, por lo tanto, puede ser necesario adaptar los métodos utilizados para tener en cuenta estas variaciones.

En resumen, la distribución estadística de Gumbel es un modelo utilizado en el análisis de eventos extremos y, en particular, en la estimación de tasas de retorno de precipitación. Su aplicación permite obtener mapas que representan la probabilidad de ocurrencia de eventos.

Aquí te comparto un vídeo tutorial en el cual explico esto a nivel práctico estimando la distribución de Gumbell para la tasa de retorno de precipitación a 2, 5, 10, 25, 50 y 100 años, todo esto con la ayuda de la librería extRemes del lenguaje R.

Si requieres asesoría personalizada me puedes escribir a mi correo electrónico o Whatsapp.
Análisis multicriterio con R – Ubicación óptima para la ubicación de un área recreativa

abril 9, 2023

Los criterios que se utilizan en el análisis multicriterio espacial pueden variar dependiendo del objetivo del análisis. En este caso, nos enfocaremos en cinco criterios principales: accesibilidad, topografía, temperatura, áreas protegidas y ríos, para identificar áreas óptimas para ubicar un área recreativa en el departamento de Cundinamarca. Esto con datos tanto a nivel raster como shapefile. En la siguiente imagen se ilustra un poco a la izquierda los criterios a tener en cuenta para el análisis y a la derecha el resultado producto de la sobreposición, o como se conoce en SIG, el overlay de las capas mencionadas.

El vídeo tutorial se encuentra en mi canal de YouTube.

El vídeo tutorial se encuentra en mi canal de YouTube.

Los códigos y datos es posible descargarlos de mi repositorio tutoriales de Github.
Google Earth Engine – R para análisis de datos de cobertura de la tierra (MODIS)

marzo 11, 2023

En este tutorial haremos uso de Chat-GPT3 para la generación de un código en Google Earth Engine que nos permita descargar datos de cobertura de la tierra de una colección de MODIS, y luego en R realizamos la lectura de estos datos y graficamos mapas desde el año 2001 hasta el 2020.

Al final realizaremos este mapa:

Recuerda que en el tutorial te comparto los datos y códigos para que repliques el ejercicio, aquí el enlace

https://github.com/fabiolexcastro/modis_landcoverGEE

El vídeo en YouTube aquí:

Sí requieres asesoría personalizada me puedes contactar a mi Whatsapp:
Global Forest Analysis – Aplicación de librería de R para analizar datos de cobertura boscosa entre 2000 y 2020 para una zona en Colombia

febrero 9, 2023
El presente tutorial ilustra el cómo:
1. Hacer la descarga de datos de cobertura boscosa, pérdida de bosque, ganancia de esta misma variable.
2. Recorte del área para una zona en particular, en este caso, el departamento de Caquetá en Colombia
3. Estimación de umbral para identificar cuáles son las zonas con bosque y no bosque para el año 2000
4. Conteo de area con pérdida de bosque entre el 2001 y el 2020
5. Realización de gráfica con los resultados del punto anterior
Este tutorial se realiza con el uso del lenguaje de programación de R y haciendo uso además de la IDE de RStudio, el tutorial lo puedes visitar en mi canal de YouTube «Un geógrafo en YouTube»

Si quieres replicar este ejercicio aquí te comparto el código y los datos, clic aquí.

Deseas contactar conmigo para asesoría, escríbeme al Whatsapp.
Modelo Random Forest para estimación del nicho ecológico de una especie forestal

enero 26, 2023
En el presente tutorial realizamos una modelación con Random Forest para la especie Coyol (Acrocomia mexicana), la cual nos permitirá estimar las áreas idóneas – nicho ecológica para esta especie en el país de México de donde es originaria. Para la aplicación requerimos tener instalado R 4.2.2. (o última versión) y RStudio, así como también algunas librerías tales como SSDM, terra, rgbif y tidyverse.
```
# Load libraries ----------------------------------------------------------
require(pacman)
pacman::p_load(rnaturalearthdata, rnaturalearth, cptcity, SSDM, ggspatial, raster, terra, sf, fs, glue, tidyverse, rgbif, geodata)
```
Al final del tutorial aprenderás a realizar un mapa como el siguiente.

Para acceder a los códigos puedes dar clic aquí. Los datos a utilizar se descargan con el mismo R.

Si te interesa conocer más sobre los modelos random forest y ampliar al respecto, te pueden servir estas dos lecturas.
- Artículo científico base: https://link.springer.com/article/10.1023/A:1010933404324
- Manual de la librería SSDM https://cran.r-project.org/web/packages/SSDM/SSDM.pdf
Recuerda apoyarme, por favor, compartiendo este contenido con tus amigos y colegas a quienes creas que este vídeo les puede servir, y no olvides en contactarme a mi Whatsapp si requieres ayuda / asesoría.
Clusterización con el método Random Forest

enero 12, 2023
En este tutorial realizamos una clasificación climática de las cuencas hidrográficas en Colombia usando la técnica de Machine Learning – Random Forest; aquí hacemos uso de los datos de Worldclim y de las cuencas hidrográficas delimitadas por el IDEAM.

Al final del vídeo aprenderemos a realizar este mapa con el método RF.

En este tutorial se realizan varios pasos:
1. Descarga de datos climáticos de temperatura y precipitación
2. Creación de variables bioclimáticas
3. Estadística zonal para las cuencas hidrográficas de Colombia, con las variables bioclimáticas
4. Estimación de los clústers con Random Forest
5. Elaboración de boxplot para identificar los nombres de los clústers
6. Realización del mapa
El vídeo lo puedes ver en mi canal en YouTube

Para acceder a los datos y código puedes visitar este enlace.

Si requieres asesoría personalizada / clases, me puedes contactar por medio del Whatsapp

recent posts

about

Evapotranspiración Potencial e Índice Estandarizado de Precipitación a Nivel Espacial

Pre-procesamientos modelos de nicho ecológico

Estadística espacial – Geoestadística

Cálculo de distancia euclideana con R – Índice de accesibilidad

Distribución de gumbel para mapas de retorno de precipitación – Ejercicio práctico con R

Análisis multicriterio con R – Ubicación óptima para la ubicación de un área recreativa

Google Earth Engine – R para análisis de datos de cobertura de la tierra (MODIS)

Global Forest Analysis – Aplicación de librería de R para analizar datos de cobertura boscosa entre 2000 y 2020 para una zona en Colombia

Modelo Random Forest para estimación del nicho ecológico de una especie forestal

Clusterización con el método Random Forest