ETL de Exemplo com PySpark, SQLAlchemy

Este é um exemplo de um aplicativo ETL (Extract, Transform, Load) desenvolvido com PySpark e SQLAlchemy, onde foram aplicados conceitos de SOLID, Hexagonal Architecture, Clean Architecture, DDD, TDD e design patterns.

Objetivo

O objetivo deste projeto é demonstrar uma estrutura robusta e modular para a construção de um aplicativo ETL em Python, utilizando ferramentas populares como PySpark para processamento de big data e SQLAlchemy para interação com banco de dados.

Tecnologias Utilizadas

PySpark: PySpark é uma biblioteca Python para processamento de big data, construída sobre o Apache Spark. Utilizamos o PySpark para realizar a extração, transformação e carregamento de grandes volumes de dados.
SQLAlchemy: SQLAlchemy é uma biblioteca Python popular para mapeamento objeto-relacional (ORM) e interação com banco de dados SQL. Utilizamos o SQLAlchemy para conectar e interagir com o banco de dados.

Como Executar o Projeto

Clone este repositório para o seu ambiente local.
Instale as dependências do projeto.
Execute os testes do projeto.
Execute o aplicativo ETL.

Contribuição

Contribuições são bem-vindas! Sinta-se à vontade para abrir uma issue ou enviar um pull request com sugestões, correções ou novas funcionalidades.

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
.github/workflows		.github/workflows
.vscode		.vscode
datalake		datalake
jupyter		jupyter
src		src
tests		tests
.gitignore		.gitignore
README.md		README.md
docker-compose.yml		docker-compose.yml
env_example		env_example
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
teste.csv		teste.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ETL de Exemplo com PySpark, SQLAlchemy

Objetivo

Tecnologias Utilizadas

Como Executar o Projeto

Contribuição

About

Releases

Packages

Languages

felipeit/etl-pyspark-demo

Folders and files

Latest commit

History

Repository files navigation

ETL de Exemplo com PySpark, SQLAlchemy

Objetivo

Tecnologias Utilizadas

Como Executar o Projeto

Contribuição

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages