Base de acórdãos do Tribunal de Contas da União

1. Fonte

Os dados foram coletados do portal do TCU.

2. Metodologia

A coleta ocorreu por meio de web crawling. O processo foi interativo e envolveu mais de uma abordagem. A primeira se deu pelo uso da biblioteca Selenium implementado pela classe AcordaosTCU localizada em scripts.crawler. O segundo approach foi feito pelo uso do scrapy por meio da classe ApiSpider localizado em crawlers.projects.api_acordaos.apiacordao.apiacordao.spiders.api.

3. Dados Abertos Publicados

Os dados consolidados estão publicados na plataforma Kaggle. Estes dizem respeito aos acórdãos proferidos pelo TCU entre os anos de 1992 até 30/08/2019. O conteúdo está armazenado em um arquivo sqlite3 (.db) e possui aproximadamente 3.8GB.

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
crawlers/projects/api_acordaos/apiacordao		crawlers/projects/api_acordaos/apiacordao
imgs		imgs
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.ini		config.ini
get-acordaos.py		get-acordaos.py
get-urls.py		get-urls.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Base de acórdãos do Tribunal de Contas da União

1. Fonte

2. Metodologia

3. Dados Abertos Publicados

About

Releases

Packages

Languages

License

netoferraz/acordaos-tcu

Folders and files

Latest commit

History

Repository files navigation

Base de acórdãos do Tribunal de Contas da União

1. Fonte

2. Metodologia

3. Dados Abertos Publicados

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages