Skip to content

Latest commit

 

History

History
44 lines (29 loc) · 1.07 KB

README.md

File metadata and controls

44 lines (29 loc) · 1.07 KB

image image image

🔥stopwords-zh🔥


欢迎提交更新,共建中文停用词库

Install

pip install -U stopwords-zh

Usages

  • source: string, 停用词来源,目前支持
    • baidu: 百度停用词表
    • hit: 哈工大停用词表
    • ict: 中科院计算所停用词表
    • scu: 四川大学机器智能实验室停用词库
    • cn: 广为流传未知来源的中文停用词表
    • marimo: Marimo multi-lingual stopwords collection 内的中文停用词
    • iso: Stopwords ISO 内的中文停用词
    • all: 上述所有停用词并集
    • en:nltk中的英文停用词
import jieba
from stopwords import stopwords, filter_stopwords

print(filter_stopwords(jieba.cut('欢迎提交更新,共建中文停用词库')))

TODO

  • 停用词
  • 情感字典