Skip to content

基于pytorch实现的情感自然语言处理nlp模型,实现对较长评论的文本分类

Notifications You must be signed in to change notification settings

SundayVHan/nlp-classifier

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

nlp-classifier

基于pytorch实现的情感自然语言处理nlp模型,实现对较长评论的文本分类
具体模型为TextCNN模型,复现自gaussic的论文《text-classification-cnn-rnn》

相较于原论文,本模型采用jieba对中文句子进行单词划分,并以中文词汇为token进行训练与预测

本模型仅用作课程作业,模型效果一般

环境

  1. python3.11
  2. 详情参考requirements.txt

数据集

THUCTC:一个高效的中文文本分类工具包

也可以使用百度云盘下载
百度云盘 验证码:awds

下载完成后放入工程根目录下的data文件夹中(chinese-classifier/data/{下载的文件})

使用

  1. 训练词向量 python word2vec.py
  2. 训练模型 python train.py
  3. 测试模型 python test.py
  4. 自定义验证模型 predict.py p.s.输入的句子请在源码中自行修改,不要太短(否则CNN的卷积核大小会超过句子分词的数量)

About

基于pytorch实现的情感自然语言处理nlp模型,实现对较长评论的文本分类

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages