nlp-classifier

基于pytorch实现的情感自然语言处理nlp模型，实现对较长评论的文本分类
具体模型为TextCNN模型，复现自gaussic的论文《text-classification-cnn-rnn》

相较于原论文，本模型采用jieba对中文句子进行单词划分，并以中文词汇为token进行训练与预测

本模型仅用作课程作业，模型效果一般

环境

python3.11
详情参考requirements.txt

数据集

THUCTC：一个高效的中文文本分类工具包

也可以使用百度云盘下载
百度云盘验证码:awds

下载完成后放入工程根目录下的data文件夹中（chinese-classifier/data/{下载的文件})

使用

训练词向量 python word2vec.py
训练模型 python train.py
测试模型 python test.py
自定义验证模型 predict.py p.s.输入的句子请在源码中自行修改，不要太短（否则CNN的卷积核大小会超过句子分词的数量）

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.gitignore		.gitignore
README.md		README.md
loader.py		loader.py
model.py		model.py
predict.py		predict.py
requirements.txt		requirements.txt
test.py		test.py
train.py		train.py
word2vec.py		word2vec.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

nlp-classifier

环境

数据集

使用

About

Releases

Packages

Languages

SundayVHan/nlp-classifier

Folders and files

Latest commit

History

Repository files navigation

nlp-classifier

环境

数据集

使用

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages