Skip to content

Ferramenta para raspagem das informações sobre serviços disponíveis no Portal RJ Digital (www.rj.gov.br)

License

Notifications You must be signed in to change notification settings

slfabio/scrap_rj_digital

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Ferramenta desenvolvida com o framework Scrapy, usada para raspar informações sobre os serviços disponíveis no Portal RJ Digital

Como usar

Os comandos abaixo preparam o ambiente em sistema operacional Windows. É necessário ter o Python (+3.0) instalado.

Criar ambiente virtual

python -m venv .venv

Ativar ambiente virtual

.\.venv\Scripts\Activate.ps1

Instalar dependências

pip install -r .\requirements.txt

Executar raspador

scrapy crawl rj_digital_servicos

Ao final da execução, os 2 arquivos na pasta json são atualizados:

  • servicos.json - Que contém as informações sobre todos os serviços dispníveis no Portal
  • sites_externos.json - Arquivo auxiliar com o retorno da requisição para o site cadastrado no campo URL_EXTERNO de cada serviço disponível no Portal.

About

Ferramenta para raspagem das informações sobre serviços disponíveis no Portal RJ Digital (www.rj.gov.br)

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages