Este proyecto ofrece un conjunto de preprocesamientos esenciales para capas de información geoespacial, alineados con la metodología de los procesos ETEC (Estructuración y Transformación, Espacialización y Carga) del Proyecto de Investigación GEMA.
El objetivo principal es proporcionar herramientas de preprocesamiento que, aunque no siempre obligatorias, son comúnmente necesarias dentro del marco de la metodología ETEC. Estos preprocesamientos no siguen un flujo lineal, sino que su aplicación depende de la naturaleza de los datos, el formato en el que se presentan y la fuente de información.
La sección de procesamiento contiene una carpeta de R
donde ponemos a disposición una serie de ejemplos de cómo utilizar herramientas existentes para llevar a cabo diferentes pasos del proceso ETEC.
Además de estas herramientas y ejemplos, en cada una de las carpetas hay una carpeta adicional con una herramienta desarrollada en ese lenguaje para generar metadatos para los conjuntos de datos geográficos siguiendo los lineamientos de los procesos ETEC; cada una de estas carpetas contiene las instrucciones necesarias para utilizar los generadores de metadatos.
Para correr este procesamiento se requieren las siguientes herramientas:
- R (> 4.0)
- Quarto
- Paquete sf, utilizado para manipulación de información espacial
- Paquete dplyr, para manipulación de datos
- Paquete tidyr, para limpieza y organización de datos
- Paquete here, para simplificar el proceso de utilizar rutas relativas
- Paquete readr para lectura de archivos de texto
Adicionalmente te recomendamos contar con los siguientes paquetes:
- ggplot2 para visualización de datos
- janitor para limpieza de datos
- stringr para manipulación de texto.
Para utilizar el generador de metadatos en R
, es necesario contar también con los siguientes paquetes:
También recomendamos instalar el IDE Rstudio, sin embargo es posible correr este proyecto con cualquier otro IDE donde puedas utilizar R
.
/espacializacion
├── README
├── datos
│ ├── datos-auxiliares
│ ├── datos-originales
│ └── datos-procesados
├── procesamiento
│ ├
│ └── R
│ └── generador-metadatos
└── .gitignore
Para algunos de los ejemplos que presentamos aquí, utilizamos capas descargadas desde el portal de Gema. Por conveniencia, en la carpeta de datos/datos_auxiliares
de este repositorio incluimos las capas de división estatal (la cual se generó con base en el marco geoestadístico del INEGI 2020) y la división municipal (la cual se generó con base en el marco geoestadístico del INEGI 2023). Recuerda que en Gema puedes encontrar más de 500 capas de información geográfica para complementar tus análisis.
En el apartado de R
encontrarás ejemplos en formato quarto que puedes seguir para elaborar diferentes tipos de capas según los datos con los que cuentes.