Este repositorio contiene proyectos y laboratorios relacionados con el curso de procesamiento de datos. Se exploran conceptos clave de Big Data, tecnologías empresariales para BI, almacenamiento y procesamiento de datos a gran escala con herramientas especializadas.
- Almacenamiento y procesamiento de Big Data
- Bases de Datos NoSQL y SQL
- Datalakes y su implementación
- Big Data analytics y visualización de datos
- Aprendizaje Supervisado y No Supervisado con Big Data
- Procesamiento de datos en Streaming y Grafos
- Databricks: Plataforma unificada para el análisis y procesamiento de datos
- Apache Spark: Motor de procesamiento distribuido
- Python: Lenguaje principal para la manipulación y análisis de datos
Procesamiento de Datos a Gran Escala
📍 Pontificia Universidad Javeriana
👨🏫 Docente: John Corredor, PhD
¡Bienvenido a este viaje por el mundo de Big Data! 🚀