-
Notifications
You must be signed in to change notification settings - Fork 5
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Features/wordcloud #123
base: main
Are you sure you want to change the base?
Features/wordcloud #123
Conversation
Para todos os experiments, os títulos e descrições das seções poderiam ser mais claros e direcioandos para essa tarefa das componentes específicas, wordcould e pdf_extractor, eles estão como no defult de uma tarefa em branco. Para todos os deployment, o titulo está como "Nova Tarefa - Implantação" e o texto está como "Preencha aqui com detalhes sobre a tarefa". Sugiro deixar esse header igual ao dos respectivos experiments. |
No experiment do wordclous suba o aquivo com os outputs limpos. No experiment de pdf_extractor suba também o arquivo com os outputs limpos. Note que há uma caixinha de código não ultiliazda no final. |
SonarCloud Quality Gate failed. |
from typing import List, Optional | ||
|
||
|
||
def init_cut(string:str, delimiter: str): |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Seria interessante adicionar um docstring explicando o que este método faz.
return delimiter + splitted[-1] | ||
else: return "Delimiter not found." | ||
|
||
def final_cut(string:str ,delimiter: str): |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Seria interessante adicionar um docstring explicando o que este método faz. Assim como os outros métodos desenvolvidos.
else: | ||
return None | ||
|
||
def read_memory(stream, |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Adicionar um docstring explicitando o que cada variável representa seria interessante.
Ex:
'''
Lê e pré processa os dados de um stream...
Parameters:
=========
stream (tipo): Descrição...
...
'''
@@ -340,8 +348,33 @@ def paracrawl_test_data(): | |||
"names":["text_english","text_portuguese"] | |||
}, | |||
} | |||
return data | |||
return dat |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Isso gerou um erro em outros componentes. O correto anteriormente escrito era return data
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Mencionei um ponto que está causando erro em outras tasks; e esta PR está causando conflito com o datasets.py, precisam ser resolvidos antes do merge
Componente WordCloud. Pode receber textos em .csv ou apenas string. Possui alguns parâmetros como stopwords, max_words, background_color e etc. Também foram adicionados testes para esse componente.