La importancia de R en la ciencia de datos

En la era actual, la ciencia de datos es un campo en constante crecimiento y evolución, y aprender a programar en R es una habilidad clave para cualquier persona interesada en trabajar en este campo. Algunas de las razones por las que es importante aprender a programar en R son:

  1. R es un lenguaje de programación de ciencia de datos muy popular: R es uno de los lenguajes de programación más utilizados en el campo de la ciencia de datos, por lo que aprender a programar en R te abre la puerta a una amplia gama de oportunidades de trabajo.
  2. R es muy versátil: R se utiliza en una amplia variedad de aplicaciones, desde el análisis estadístico hasta el aprendizaje automático. Esto significa que si aprendes a programar en R, podrás aplicar tus habilidades a una amplia gama de problemas y proyectos.
  3. R es una herramienta de análisis de datos muy potente: R viene con una amplia gama de paquetes y librerías que te permiten hacer prácticamente cualquier cosa con tus datos. Además, la comunidad de R es muy activa y siempre está desarrollando nuevas herramientas y funcionalidades.
  4. R es de código abierto: Como lenguaje de programación de código abierto, R es gratuito y está disponible para todos. Esto significa que no tienes que preocuparte por licencias o costos ocultos.

En resumen, aprender a programar en R es una habilidad importante para cualquier persona interesada en trabajar en el campo de la ciencia de datos. Te permite acceder a una amplia gama de oportunidades de trabajo, trabajar en una amplia variedad de proyectos y utilizar una herramienta de análisis de datos muy potente y versátil. Además, al ser de código abierto, R es accesible para todos.

El análisis espacial

El análisis espacial es una rama de la ciencia de datos que se centra en el análisis de datos geográficos y en la resolución de problemas que tienen un componente espacial. R es un lenguaje de programación que se ha vuelto muy popular para el análisis espacial debido a su amplia gama de paquetes y librerías que facilitan este tipo de análisis.

Uno de los principales atractivos de R para el análisis espacial es su amplia variedad de paquetes disponibles. Por ejemplo, el paquete sp proporciona una serie de funciones para trabajar con datos espaciales vectoriales y raster, mientras que el paquete raster se especializa en el manejo de datos raster. Además, hay muchos otros paquetes que ofrecen funcionalidades específicas para el análisis espacial, como rgeos para el análisis de geometría, rgdal para la lectura y escritura de datos espaciales vectoriales y raster, y leaflet para la creación de mapas interactivos.

Además de los paquetes específicos para el análisis espacial, R también cuenta con una amplia variedad de funcionalidades estadísticas y gráficas que son útiles para el análisis espacial. Por ejemplo, R cuenta con una amplia variedad de gráficos de dispersión y mapas que pueden ser utilizados para visualizar y explorar datos espaciales. También hay muchas funciones para el análisis estadístico, como la regresión lineal y la regresión espacial, que son útiles para el análisis de datos espaciales.

En resumen, R es una herramienta muy potente para el análisis espacial debido a su amplia gama de paquetes y librerías especializados y a sus funcionalidades estadísticas y gráficas. Si estás interesado en el análisis espacial, R es una herramienta valiosa que debes tener en tu caja de herramientas.

Modelamiento con Ecocrop para identificar impacto del cambio climático sobre el cultivo de café

El presente tutorial es la continuación de un previo tutorial en el cual identificamos las zonas idóneas para el cultivo de café bajo la línea base, ahora bien, en esta ocasión realizaremos el análisis con datos de cambio climático. Dentro del mismo tutorial realizamos la descarga de los rasters de cambio climático con el SSP 585 para el GCM ACCESS-CM2 y el periodo 2021- 2040.

El mapa que tendremos al final del tutorial será:

El vídeo tutorial:

Códigos y datos: https://github.com/fabiolexcastro/tutorials_youtube/tree/master/ecocropFuture

Si quieres chatear conmigo

Descarga de datos del Banco Mundial y la FAO

Descarga de información socioeconómica de bases de datos como el Banco Mundial y la FAO, esto con ayuda de la librería WDI y FAOSTAT del lenguaje de programación de R. Análisis de información descargada, procesamiento de la misma, homegeneización y unión con archivos espaciales de países a nivel mundial.

El vídeo tutorial se encuentra disponible en mi canal de YouTube: Un geógrafo en YouTube. Aquí:

Códigos y datos disponibles aquí:https://github.com/fabiolexcastro/tutorials_youtube/tree/fabiolexcastro-patch-1/worldData

Preguntas, consultas y asesoría:

Tour por RStudio¿Cómo cambiar los temas y el font (tipo de letra?

Es posible mejorar o mejor dicho, agregar nuevos temas dentro de RStudio, distinto a los que vienen por defecto cuando instalamos R, así como también, podemos agregar nuevas fonts (tipo de letra) para ver mejor el texto en los códigos, tipo hacker inclusive. Estos heredados de otras IDE, como lo es VisualStudioCode.

En este caso debemos instalar primero la librería remotes en R y luego instalar rsthemes.

install.packages('devtools')
library(devtools)
devtools::install_github("gadenbuie/rsthemes")
library(rsthemes)
rsthemes::install_rsthemes()
rsthemes::install_rsthemes(include_base16 = TRUE)

Aquí te dejo un vídeo tutorial en mi canal de YouTube para que puedas visualizar un poco mejor cómo hacer el cambio en el tema de R.

Para pasar de esto:

A esto:

Este es solo un ejemplo, pero hay gran cantidad de temas que los puedes explorar una vez los hayas instalado.

El enlace donde están los pasos y el código para la instalación de Rstudio: https://github.com/gadenbuie/rsthemes

Página web para descargar las fonts (tipos de letra): https://www.nerdfonts.com/

Sí requieres ayuda / asesoría personalizada, me puedes contactar vía whatsapp:

Creación de Dashboard para visualización de gráficos y mapas en R

En este tutorial realizamos un dashboard, que es básicamente un visor iteractivo de datos, en este caso espaciales referentes a los municipios ZOMAC y PEDET, son los municipios que más han sido afectados por el conflicto armado en Colombia, producto del surgimiento y accisón de grupos al margen de la ley, tales como las FARC – EP y el ELN.

Esta temática aquí presentada hace parte del trabajo de tesis de maestría en Ciencias de la Información Geográfica de la Universidad de Salzburgo en Austria (parte del programa de UNIGIS).

Aquí un screen de lo que realizamos en el vídeo tutorial

Si deseas replicar este ejercicio, puedes descargar tanto los datos como el código de mi respositorio en GitHub.

Código: https://github.com/fabiolexcastro/tutorials_youtube/blob/master/flexdashboardMaps/data/flexhdashboard.Rmd

Datos: https://github.com/fabiolexcastro/tutorials_youtube/tree/master/flexdashboardMaps/data

En el caso que tengas alguna duda o pregunta al respecto me puedes escribir a mi whatsapp:

Mapa de población de Colombia a nivel de municipio con R y leaflet

El presente es un tutorial para la realización de un mapa de población con R, esta vez haremos uso de leaflet para realizar el mapa iteractivo, esto nos permite visualizar la cantidad de habitantes cuando nos paramos sobre cada uno de los municipios.

Hacemos uso de datos del DANE de población para el año 2017, así como también los datos de municipios del IGAC (OT).

En este tutorial, tenemos dos datos:

  1. Tabla de cantidad de habitantes a nivel municipal para el año 2017
  2. Shapefile de municipios según la base de datos del IGAC

Estos dos archivos se unen mediante el comando inner_join, siendo esto lo trabajado en el código 01, ya en el código 02 se realiza el mapa y la customización del mismo.

Si quieres descargar los datos y replicar el ejercicio, puedes visitar mi reposititorio en GitHub. Clic aquí.

Vale la pena mencionar que es posible publicar este mapa en GitHub, para ello, tengo un vídeo tutorial en YouTube el cual puedes visitar en este enlace.

Descarga de información de cambio climático a escala diaria desde R

El presente tutorial ilustra el cómo descargar información de cambio climático según el sexto informe de cambio climático del IPCC, conocido como CMIP6.

Estos datos son archivos espaciales tipo raster de variables como precipitación, temperatura máxima y temperatura mínima, vienen a resolución espacial de aproximadamente 55 km, y una resolución temporal diaria. Es posible descargar estos archivos de forma manual, visitando el sitio web de CORDEX.

Dar clic en la imagen para visitar el sitio web.

Ahora bien, con el apoyo de R y de un par de librerías, es posible hacer la descarga automatizada de estos datos, tanto los históricos, como los futuros para los distintos SSP, tales como:

  • SSP 126
  • SSP 245
  • SSP 370
  • SSP 585

Recordemos que estos son distintos modelos que se basan en el comportamiento del hombre en temas socioeconómicos de cara al futuro (sobre el tema). En la siguiente figura se ilustran los distintos cambios de CO2 según los SSPs.

Siguiendo con el tutorial, ya he publicado un vídeo en YouTube donde se explica cómo descargar la información con la ayuda de R, decir además que estos datos se descargar a resolución apróximada de 55 km2, está información es posible procesarla para mejorar la resolución espacial a 5 km o 1 km de ser necesario.

Para replicar el ejercicio, puedes visitar mi repositorio de GitHub.

Descarga de información espacial con Open Street Maps en R

En este tutorial aprenderás a descargar información espacial desde R, haciendo uso de los datos de Open Street Maps, se usa como caso de estudio la ciudad de Santiago de Cali (ciudad en la que vivo), sin embargo, está es replicable a cualquier lugar del mundo. Al final realizaremos el siguiente mapa, donde ubicamos las principales vías y los bares nocturnos en Cali.

Con la librería de osmdata se bajan los datos, tales como: comunas, vías principales, ríos, y bares.

Para desarrollar este ejercicio debes tener instalada la última versión de R, y en lo posible instalada la IDE de RStudio.

El vídeo tutorial está disponible aquí:

Para descargar el código puedes visitar mi repositorio en GitHub.

Sí requiere ayuda con el vídeo tutorial o asesorías con tus proyectos de Sistemas de Información Geográfica me puedes contactar mediante mi número de Whatsapp.

Publicación de mapa de leaflet en GitHub

En el presente tutorial haremos la integración de tres distintas plataformas muy útiles…

Con GBIF descargaremos presencias de una especie de frailejon, luego entonces con leaflet en R realizaremos el mapa interactivo, y posteriormente con la ayuda de GitHub se publicará el mapa en línea. Todo esto se hace uso con software libre, open source, al gratin.

Para poder realizar este tutorial debes tener cuenta creada en GitHub, es muy similar al crear una cuenta en una red social, sigue este enlace. Debes además tener instalado R versión 4.2.1 y por facilidad tener instalada la versión última de RStudio, o si bien lees esto después de octubre del 2022, tener instalado Posit.co, ya dentro de R debes tener instaldo algunas librerías, tales como:

library(leafletr)
library(tidyverse)
library(html)
library(terra)
library(sf)
library(fs)

El vídeo tutorial explicativo, está disponible en mi canal de YouTube, Un Geógrafo en YouTube.

Los datos y el código está disponible en mi repositorio de GitHub.

Te agradezco un montón si sigues el bog, el canal en Youtube y en mis redes sociales como facebook. Ayúdame a seguir creando contenido de este tipo, y que esta comunidad siga creciendo. Recuerda que soy: Fabio Lex Castro, de Un Geógrafo en YouTube.

Si requieres asesoría o ayuda con tus proyectos o con la realización de este tutorial, no dudes en contactarme mediante el Whatsapp: