Skip to content

Latest commit

 

History

History
19 lines (14 loc) · 1.31 KB

README.md

File metadata and controls

19 lines (14 loc) · 1.31 KB

ETL de Exemplo com PySpark, SQLAlchemy

Este é um exemplo de um aplicativo ETL (Extract, Transform, Load) desenvolvido com PySpark e SQLAlchemy, onde foram aplicados conceitos de SOLID, Hexagonal Architecture, Clean Architecture, DDD, TDD e design patterns.

Objetivo

O objetivo deste projeto é demonstrar uma estrutura robusta e modular para a construção de um aplicativo ETL em Python, utilizando ferramentas populares como PySpark para processamento de big data e SQLAlchemy para interação com banco de dados.

Tecnologias Utilizadas

  • PySpark: PySpark é uma biblioteca Python para processamento de big data, construída sobre o Apache Spark. Utilizamos o PySpark para realizar a extração, transformação e carregamento de grandes volumes de dados.
  • SQLAlchemy: SQLAlchemy é uma biblioteca Python popular para mapeamento objeto-relacional (ORM) e interação com banco de dados SQL. Utilizamos o SQLAlchemy para conectar e interagir com o banco de dados.

Como Executar o Projeto

  1. Clone este repositório para o seu ambiente local.
  2. Instale as dependências do projeto.
  3. Execute os testes do projeto.
  4. Execute o aplicativo ETL.

Contribuição

Contribuições são bem-vindas! Sinta-se à vontade para abrir uma issue ou enviar um pull request com sugestões, correções ou novas funcionalidades.