Skip to content

Latest commit

 

History

History
26 lines (19 loc) · 1.77 KB

README.md

File metadata and controls

26 lines (19 loc) · 1.77 KB

这是北京国双科技有限公司去年(2016)办的一个比赛。具体的竞赛介绍可以参照:竞赛概述. 大致的任务可以分为“视角提取”和“基于视角的情感分析”两部分。赛方提供了汽车评论数据。

  • 视角抽取:又称为“视角识别”。顾名思义,这一任务意在从文本中抽取(识别)出可以描述视角的词语。由于在本次任务中,视角特指汽车品牌词,故这一步的任务需要参赛队伍抽取(识别)出文本中的汽车品牌词(或别名)。
  • 基于视角的情感分析:给定一个句子,如果该句子中包含“视角”词语,则应针对这一视角进行情感分析;如果句子中包含多个“视角”词语,则应对不同的视角进行单独的情感分析;如果句子中不包含视角,则不做情感判别处理。

例如: 在“A车在第三季度一举超过B车成为销量冠军”这样一句话中,如果分析者站在A车的角度去考虑,这句话就是正面的,但是如果分析者在B车的角度,则丢失了销量冠军这样一则消息是负面的。而在本句话中,“A车”和“B车”则是两个不同的情感视角。

命名实体识别+情感分类

将命名实体识别和分类分成两部分来实现。

  • 命名实体识别部分:使用 Bi-LSTM+HMM 来实现。(待更新:Bi-LSTM+CRF)
  • 基于视角的情感分类:使用 Bi-LSTM 和 SVM。

端到端的序列标注方法

直接使用序列标注的方法,进行正向视角、中性视角和负向视角标注。

环境依赖

  • python2.7
  • numpy
  • pandas
  • matplotlib
  • tensorflow 1.1.0(gpu version)