Skip to content

Latest commit

 

History

History
41 lines (23 loc) · 3.54 KB

uiramirim.md

File metadata and controls

41 lines (23 loc) · 3.54 KB

Projeto Uiramirim

Objetivo

O Projeto Uiramirim é uma iniciativa conjunta do grupo de pesquisa Computação e Linguagem Natural (CompLin), coordenado pelo Prof. Dr. Leonel Figueiredo de Alencar Araripe, do Programa de Pós-graduação em Linguística do Centro de Humanidades da Universidade Federal do Ceará, e o grupo de pesquisa do Prof. Dr. Alexandre Arruda, do Laboratório de Tecnologias Inovadoras, vinculado ao Curso de Ciência da Computação do campus de Russas da Universidade Federal do Ceará.

O projeto visa tornar disponíveis na plataforma Telegram ferramentas de processamento computacional do nheengatu, também conhecido como tupi moderno e Língua Geral Amazônica, desenvolvidas pelo professor Leonel e seus orientandos de iniciação científica e pós-graduação. A implementação da interface em Telegram tem sido levada a cabo pelo professor Alexandre e sua equipe, com a colaboração dos membros do CompLin.

Ferramentas e recursos

O Projeto Uiramirim encontra-se em fase de inicial de construção. Novas funcionalidades e aperfeiçoamentos estão sendo continuamente introduzidos. Algumas ferramentas e recursos ainda são bastante incipientes. Nem todos os itens listados a seguir estão disponíveis no aplicativo do Telegram, apenas no repositório do CompLin na plataforam GitHub.

Ferramentas

  • Tradutor automático
  • Etiquetador morfossintático
  • Analisador morfológico
  • Analisador sintático dependencial

Recursos

  • Corpus etiquetado morfossintaticamente
  • Banco de árvores (treebank) no formato UD
  • Glossário

Referências

O tradutor automático é descrito em detalhe em Alencar (2021). O glossário reproduz, essencialmente, a listagem de lemas, classes de palavras e acepções de Navarro (2016), com vários novos itens extraídos do dicionário de Avila (2021). Tendo em vista a construção de ferramentas de processamento computacional do nheengatu, diversas alterações foram realizadas no glossário original, que estão documentadas no repositório do CompLin. Algumas dessas alterações levam em conta a gramática de Cruz (2011). As ferramentas de análise automática, como o etiquetador morfossintático e o analisador morfológico, por sua vez, tomam como ponto de partida essa versão modificada do glossário de Navarro (2016).

ALENCAR, Leonel Figueiredo de. Uma gramática computacional de um fragmento do nheengatu / A computational grammar for a fragment of Nheengatu. Revista de Estudos da Linguagem, Belo Horizonte, v. 29, p. 1717-1777, 2021. DOI: doi:http://dx.doi.org/10.17851/2237-2083.29.3.1717-1777. Acesso em: 23 mar. 2022.

AVILA, Marcel Twardowsky. Proposta de dicionário nheengatu-português. 2021. 883f. Tese (Doutorado em Estudos da Tradução) – Faculdade de Filosofia, Letras e Ciências Humanas, Universidade de São Paulo, São Paulo, 2021. DOI: https://doi.org/10.11606/T.8.2021.tde-10012022-201925. Acesso em: 17 set. 2022.

CRUZ, Aline da. Fonologia e gramática do nheengatú: a língua falada pelos povos Baré, Warekena e Baniwa. Utrecht: LOT, 2011.

NAVARRO, Eduardo de Almeida. Curso de Língua Geral (nheengatu ou tupi moderno): a língua das origens da civilização amazônica. 2. ed. São Paulo: Centro Angel Rama da Faculdade de Filosofia, Letras e Ciências Humanas da Universidade de São Paulo, 2016.

Equipe

Membros do projeto Uiramirim (lista com os nomes) (TODO)