Análisis Lisa dentro de R – Aplicación para la cantidad de homicidios a nivel de barrio en la ciudad de Cali

El presente documento hace parte de mi vídeo tutorial publicado en YouTube.

Para acceder a los códigos y datos dar clic aquí.

En esta ocasión realizamos el análisis espacial del comportamiento de la cantidad de homicidios por barrio para la Ciudad de Cali en el año 2019, esto mediante la aplicación del Indicador Local de Asociación Espacial (LISA, por sus siglas en inglés).

Este tipo de análisis de autocorrelación espacial, según Buzai (2021) están considerados muchas veces en la bibliografía especailizada dentro de los denominados Análisis Exploratorio de Datos Espaciales (AEDE) por la importancia que revisten al momento de describir y visualizar las distribuciones espaciales con el objetivo de identificar y visualizar la asociación espacial, los agrupamientos (clusters) o puntos calientes (hot spots) y las estructuras espaciales. Tal como se mencionó líneas arriba, en esta ocasión analizaremos el comportamiento espacial (si existen o no agrupamientos de los barrios) de los barrios en función de la cantidad de homicidios, los datos provienen de la Policia Nacional en conjunto con el Centro de Investigación y Documentación Socioeconómica de la Universidad del Valle.

Si deseas ahondar más en el tema te invito a que sigas y consultes el siguiente libro de Buzai (autor citado).

Curso de Módelos de Distribución de Especies

Pronto en Udemy.

Módulo 01 – Repaso general del R

  • Principales objetos dentro de R, vectores, matrices, listas, cadenas de texto, números, cáracteres, tablas. Lectura de tablas, aplicación de operaciones entre estas.
  • Aplicación de ciclos (for), aplicación de la familia de apply (lapply, sapply, tapply, mapply)
  • Creación de funciones, aplicación de estas.
  • Uso de la librería tidyverse, uso de funciones tales como mutate, transmute, select, filter, grooup_by, summarise.

Módulo 02Introducción a los SDM

  • Explicación sobre lo que son los modelos de distribución, ¿para qué sirven? ¿cuándo se pueden utilizar? ¿qué formas de aplicación tienen? Diapositiva
  • Datos necesarios para la realización de los modelos de distribución de especies, variables, co-variables, y resultados Diapositiva
  • Ejemplos de estudios de modelación de distribución de especies, revisión de literatura científica. Diapositiva

Módulo 03 – Preparación de los datos para la modelación

  • Recolección de datos para estudios de SDM, descarga de puntos de presencias usando GBIF.
  • Uso de la librería RGBIF para descarga de presencias de R.
  • Datos climáticos, módelos RCPs y SSPs. Diapositiva.
  • Descarga de datos climáticos (línea base y futuro), topográficos, disivisón político administrativa, entre otros. Uso de la librería geodata con R.
  • Ejercicio de downscaling para datos climáticos, desescalado de 5 km a 1 km, uso del método Geographically Weighted Regression, uso del software SAGA.
  • Limpieza de puntos de presencia, eliminación de duplicados por celda.
  • Aplicación de técnicas para la eliminación de posibles datos atípicos.
  • Generación de datos de psuedoausencia, ¿para qué se usan? ¿cómo generarlos con R?

Módulo 04 – Módelos de distribución de especies, aplicación

  • Orden de la estructura de datos, carpetas, y espacio de trabajo para la aplicación de modelos. Instalación de rJava, actualización de Java, descarga del software de Maxima Entropía
  • Uso del aplicativo de Java para aplicaciáon del método de Máxima Entropía
  • Uso de módelos de máxima entropía, bioclim, domain, mahalanobbis. Aplicación de técnicas de cross-validation, evaluación del módelo, cálculo del índice de Kappa
  • Técnicas de clúster jerárquicos para la agrupación de presencias de especies vegetales.
  • Uso de Random Forest dentro de R para la estimación de la idoneidad probabilística para una especie, introducción al uso de las zonas agroclimáticas, aplicación dentro de cultivos tropicales.
  • Estimación de zonas con limitaciones / aptitud incierta.
  • Generación de mapas de zonas agroclimáticas

Módulo 05: Proyección de zonas idóneas de cara al futuro, análisis de cambio climático sobre la distribución de las especies

  • Análisis de las capas resultado, overlay con datos político administrativos
  • Estimación de los umbrales de idoneidad, conversión de capas continúas a capas binarias
  • Proyección de zonas idóneas para las especies a partir de datos de cambio climático, modelos de Random Forest y MaxEnt
  • Comparación áreas de idoneidad actual y futura – Modelo de MaxEnt
  • Comparación áreas de idoneidad actual y futura – Modelo de Random Forest
  • Elaboración mapa de impresión de la distribución potencial actual y futura, así como también el mapa de cambio de idoneidad.

SIG con R

SIG con R

MÓDULO 1. Instalación y primeros pasos con R

  • ¿Qué es R y RStudio? DIAPOSITIVA
  • Instalación de R
  • Instalación de RStudio
  • Instalación y carga de las librerías
  • Conocimiento de la interfaz de R y RStudio, diferencias entre ellas.

MÓDULO 2. Introducción al uso de R

  • Conociendo los distintos objetos en R, numérico, cáracteres, vectores, listas, matrices, entre otros
  • Usando R como calculadora (suma, resta, multiplicación, división, raíz cuadrado, exponencias, logaritmos, entre otros)
  • Guía de estilo en R
  • Lectura y escritura de tablas de csv y excel dentro de R
  • Operaciones entre distintas tablas y distintos tipos de unión entre ellas (merge)
  • Análisis de tablas dentro de R, agregación de nuevas columnas, filtros, conteo, frecuencia, cambio en la estructura de las mismas, orden ascendente y descencente

MÓDULO 3. Gráficos, Ciclos, Funciones y Condicionales en R

  • Gráficos básicos dentro de R, barras, líneas, boxplot, histogramas
  • Uso de ciclos dentro de R
  • Uso de funciones dentro de R
  • Uso de condicionales dentro de funciones

MÓDULO 4. Uso de librerías de ciencia de datos

  • Uso de la librería tidyverse, funciones como mutate, select, group_by, transmute, spread, gather, summarise, mutate_at, ungroup, entre otros.
  • Gráficos avanzados con ggplot2, barras, boxplot, torta, histogram, violin plot, entre otros.

MÓDULO 5. Teoría básica de SIG

  • ¿Qué es un shapefile? tipos de shapefile. DIAPOSITIVA
  • ¿Qué es un raster? tipos de raster. DIAPOSITIVA
  • ¿Qué es un stack?. DIAPOSITIVA.
  • Lectura de archivos raster dentro de R
  • Lectura de archivos shapefile dentro de R
  • Lectura de archivos nc dentro de R

MÓDULO 6. Análisis espacial con R

  • Operaciones espaciales con archivos shapefile, clip, buffer, intersect, filter, dissolve.
  • Operaciones espaciales con archivos raster, álgebra de mapas, extracción por máscara.
  • Lectura de gran cantidad de archivos espaciales tipo raster.
  • Definición y proyección de sistemas coordenadas a archivos shapefile y raster.
  • Cálculo de estadísticas zonales con archivos raster

MÓDULO 7. Elaboración de Mapas con R

  • Creación de mapas (uso de la librería ggplot2) con archivos espaciales tipo raster.
  • Creación de mapas (uso de la librería ggplot2) con archivos espaciales tipo shapefile.
  • Creación de mapas (uso de la librería ggplot2) con archivos espaciales tipo shapefile y raster.
  • Agregación de web map services, uso de la librería leaflet

Aporte de los SIG en el marco del desarrollo de un país

Los SIG se constituyen como una herramienta para la ayuda en la toma de decisiones (Olaya, 2009), esto pues responden a la gran pregunta ¿dónde?, por ejemplo, ¿dónde ubicar un hospital de primer nivel?, ¿dónde localizar escuelas?, ¿dónde se podrían dar fenómenos como deslizamiento de tierras, inundaciones, o entre otros?, en este sentido, los SIG ayudan a responder todas las preguntas que tengan relación con la pregunta ¿dónde?

Todo esto se enmarca entonces en la planificación regional y el ordenamiento territorial de un país, una rama de la geografía como lo es la de riesgos hace uso de los SIG como un elemento clave en el desarrollo de propuestas sobre la prevención de riesgos, claros ejemplos son la ubicación de asentamientos humanos cerca de un río o en terreno con alta pendiente.

Otro aspecto muy importante en donde los SIG aporta, y más aún en el desarrollo de un país, son el uso de modelos de machine learning como Random Forest (Breiman, 2001) y Maxent (Phillips et al., 2006) para identificar el posible impacto del cambio climático sobre alguna especie de flora y fauna, claro ejemplos, pueden ser cultivos importantes de la región (aquí John puedes escribir los cultivos importantes de la región donde vives), los resultados obtenidos con los SIG y de la mano con los TIC es el gradiente de impacto (Bunn et al., 2014), las cuales son zonas que mantendrán, perderán idoneidad o ganaran idoneidad, con esto los planes de desarrollo pueden ir enfatizados a en cuáles zonas hacer inversiones para el desarrollo de los cultivos.

De otro lado, también los TIC y en este caso preciso los SIG pueden ser de uso para la conservación de especies que pueden estar en peligro por el cambio climático, así entonces se podría planificar sobre nuevas áreas protegidas para la conservación de las mismas, ejemplos son vistos en Reina et al (2016).

Otro aspecto que está en furor es el uso de aviones aéreos no tripulados (Radjawali et al., 2017), este uso de los TIC se destaca en el uso de situaciones de emergencia, por ejemplo, en zonas que hayan quedado fuera del alcance de medios de transporte convencionales, su velocidad de vuelo permite recorrer áreas enormes en poco tiempo y aisladas, permitiendo así llevar ayuda necesaria o evaluar la ayuda que se requiera para tal zona.

Bibliografía

Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32.

Bunn, C., Läderach, P., Jimenez, J. G. P., Montagnon, C., & Schilling, T. (2015). Multiclass classification of agro-ecological zones for Arabica coffee: an improved understanding of the impacts of climate change. PLoS One, 10(10), e0140490.

Olaya, V. (2009). Sistemas de Información Geográfica libres y geodatos libres como elementos de desarrollo. Cuadernos Internacionales de Tecnología para el Desarrollo Humano, 2009, núm. 8.

Radjawali, I., Pye, O., & Flitner, M. (2017). Recognition through reconnaissance? Using drones for counter-mapping in Indonesia. The Journal of Peasant Studies, 44(4), 817-833.

Reina-Rodríguez, G. A., Rubiano Mejía, J. E., Castro Llanos, F. A., & Soriano, I. (2017). Orchid distribution and bioclimatic niches as a strategy to climate change in areas of tropical dry forest in Colombia. Lankesteriana, 17(1), 17-47.