Procesamientos y cálculos para la Encuesta Nacional de Consumo de Drogas, Alcohol y Tabaco, ENCODAT 2016-2017.
Este repositorio es parte del movimiento de ciencia abierta, el cual busca transparentar la metodología, prácticas y resultados de los procesos de análisis de datos. En particular en este repositorio se comparten las funciones, scripts y cuadernos generados para analizar encuestas.
Como ejemplo de uso, se calcula la prevalencia en el consumo de sustancias en México y se generan tabulados con los datos de la Encuesta Nacional de Consumo de Drogas, Alcohol y Tabaco 2016-2017 (abreviada como ENCODAT 2016-2017). Sin embargo, las funciones de Python se pueden utilizar con otras bases de datos que contengan información de muestras complejas de encuestas.
Las funciones de este repositorio están hechas en Python, por ello es necesario tener instalado Python 3.10 (o superiores) para poder ejecutar los cuadernos de trabajo.
Adicionalmente se requieren las siguientes bibliotecas:
Para instalar las bibliotecas antes mencionadas es recomendable crear un entorno virtual. Existen distintas herramientas de instalación que te permiten crear entornos virtuales. En esta sección se dan las instrucciones para generar un entorno virtual con: pipenv o conda, sin embargo la persona usuaria puede utilizar la herramienta o manejador de entorno virtual que prefiera.
-
Descarga el repositorio.
-
Desde la terminal, entra a la carpeta donde se localiza este repositorio. En dicha carpeta crea un ambiente virtual con Python 3.10 y actívalo de la siguiente manera:
- con
pipenv
:
pipenv shell --python 3.10
- con
conda
:
conda create --name nombre_del_ambiente python==3.10 conda activate nombre_del_ambiente
- con
-
Activa el ambiente virtual e instala
pip-tools
dentro del ambiente virtual:- con
pip
:
pip install pip-tools==7.3.0
- con
conda
:
conda install -c conda-forge pip-tools
- con
Nota: Después de este paso, podría ser necesario reiniciar la terminal, con la finalidad de que el ambiente virtual se active correctamente.
-
Genera el archivo requirements.txt acorde arquitectura de tu sistema operativo:
pip-compile requirements.in
-
Instala las bibliotecas o dependencias:
pip-sync requirements.txt
-
Puedes asegurarte que la instalación de dependencias fue exitosa ejecutando el siguiente comando:
pip list
o
conda list
Si te aparece un listado con las bibliotecas mencionadas en la sección Requerimientos significa que la instalación fué exitosa. Nota: es normal que además de las bibliotecas requeridas se hayan instalado otras dependencias.
-
Una vez que hayas instalado lo necesario en tu ambiente virtual es posible ejecutar los cuadernos y funciones de este repositorio. Para ello, sigue las instrucciones de la sección Ejecución.
Este repositorio muestra cómo estructurar y procesar las bases de datos de la ENCODAT para estimar el consumo de sustancias mediante el cuaderno "estimacion_consumo_sustancias".
Para ejecutar el cuaderno es necesario descargar los datos de la encuesta (disponibles en este enlace) y colocarlos en la carpeta "datos/originales/". Posteriormente se ejecuta cada una de las celdas del cuaderno, si todas las celdas se ejecutan correctamente, se generan seis archivos separados por comas (csv) con los resultados de las estimaciones hechas a partir de las preguntas relativas al consumo de alcohol, drogas y tabaco.
Ahora bien, el procesamiento y estructuración de las bases de datos se hacen mediante las funciones en los módulos func_analisis y func_transformación. Las funciones son lo suficientemente generales como para poder hacer estimaciones de cualquiera de las preguntas en la encuesta, basta cambiar la clave de pregunta, definir el nivel de desagregación en el que se quieren generar las estimaciones y definir cómo se van a interpretar las claves de respuesta de la pregunta seleccionada. En el cuaderno "estimacion_general" se ejemplifica cómo se puede hacer una estimación de una pregunta arbitraria.
SOFTWARE LIBRE Y ESTÁNDARES ABIERTOS
Este proyecto se encuentra alineado al Sisdai que a su vez, parte de las disposiciones establecidas por la Coordinación de Estrategia Digital Nacional (DOF:06/09/2021) en donde se estipula que las "políticas y disposiciones tienen como objetivo fortalecer el uso del software libre y los estándares abiertos, fomentar el desarrollo de aplicaciones institucionales con utilidad pública, lograr la autonomía, soberanía e independencia tecnológicas dentro de la APF". En el artículo 63 se explicita que "cuando se trate de desarrollos basados en software libre, se respetarán las condiciones de su licenciamiento original [...]".
Para contribuir al proyecto, se pide que se haga tomando en cuenta la guía de contribución de git.