Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Sugestão de migrar para o datasets-br #6

Open
ppKrauss opened this issue May 16, 2018 · 2 comments
Open

Sugestão de migrar para o datasets-br #6

ppKrauss opened this issue May 16, 2018 · 2 comments

Comments

@ppKrauss
Copy link

ppKrauss commented May 16, 2018

Oi gente, que tal passarmos esses dados CSV e/ou o repositório todo para o "ecossistema de datasets" da OKBR?
https://github.com/datasets-br

Eu me comprometo de montar o datapackage.json com http://create.frictionlessdata.io/ se não tiverem interesse. Também me comprometo de deixar redondo pro https://goodtables.io/


O dataset de estados (UFs) por exemplo já está em https://github.com/datasets-br/state-codes
... Ai, por estarem descritos no padrão datapackage, todos os datasets são carregados automamaticamente para o SQL já em JOIN e com tabelas montadas — há ainda a opção de carregar tudo ocupando muito menos espaço na base de dados (CSV como JSONb-array).

@vgeorge
Copy link
Contributor

vgeorge commented May 21, 2018

Oi Peter, obrigado pela sugestão, mas preferimos manter o repositório na nossa organização. Não tive tempo à época para adequar ao formato datapackage, sinta-se à vontade para mandar pull request.

@ppKrauss
Copy link
Author

Olá @vgeorge , ok, vou incluir o datapackage.

... Hum... Os arquivos br-states.csv, organizations.csv e projects.csv estão ok, mas o financings.csv apresentou duplicação nas linhas 41, 111 e 127. Algum problema se deletarmos essas linhas?

goodtables financings.csv
  ...

  [41,-] [duplicate-row] Row 41 is duplicated to row(s) 40
  [111,-] [duplicate-row] Row 111 is duplicated to row(s) 110
  [127,-] [duplicate-row] Row 127 is duplicated to row(s) 126

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants