Проблемы с применением normalized() в интерпретации #73

FOX111 · 2020-07-08T08:10:11Z

Заметил, что функция normalized() для интерпретации не нормализует некоторые слова в творительном падеже, например 'утром', 'вечером'. Это вероятно связано со спецификой работы токенизатора.

list(TOKENIZER('утром'))
[MorphToken(
value='утром',
span=[0, 5),
type='RU',
forms=[Form('утром', Grams(ADVB)),
Form('утро', Grams(NOUN,ablt,inan,neut,sing))]
)]

Первой возвращенной формой является 'утром', которая вероятно и записывается в ответ. Со словами, в которых первая возвращенная форма является нормальной, такого не происходит.

The text was updated successfully, but these errors were encountered:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Проблемы с применением normalized() в интерпретации #73

Проблемы с применением normalized() в интерпретации #73

FOX111 commented Jul 8, 2020

Проблемы с применением normalized() в интерпретации #73

Проблемы с применением normalized() в интерпретации #73

Comments

FOX111 commented Jul 8, 2020