Ferramenta desenvolvida com o framework Scrapy, usada para raspar informações sobre os serviços disponíveis no Portal RJ Digital
Os comandos abaixo preparam o ambiente em sistema operacional Windows. É necessário ter o Python (+3.0) instalado.
python -m venv .venv
.\.venv\Scripts\Activate.ps1
pip install -r .\requirements.txt
scrapy crawl rj_digital_servicos
Ao final da execução, os 2 arquivos na pasta json são atualizados:
- servicos.json - Que contém as informações sobre todos os serviços dispníveis no Portal
- sites_externos.json - Arquivo auxiliar com o retorno da requisição para o site cadastrado no campo URL_EXTERNO de cada serviço disponível no Portal.