思路:在刻画的此次新型冠状病毒 ( COVID-19)传播这一重 大公共卫生事件情景下,以 大数据技术深描中国大众的 网络社会心态
获取2019年12月8日至6月中旬新浪、百度、天涯等网站,有关疫情的新闻标题、内容以及重点新闻的评论(重 点新闻是指评论量远超(考虑数据分布)其它新闻的新闻);获取央媒如荔枝网、新华网等网站12月8日-6月中 旬有关疫情的新闻标题、内容以及重点新闻的评论;
(1)心态字典:首先根据分析需求,定义相应 的心态词(如冷漠、高兴、怀疑等),再建立 一个覆盖较为全面的情绪-心态映射关系,分 析文章中的核心情绪词(如太棒了->高兴)
先将数据爬取出来,分为如上四个阶段,然后对每个阶段取出一些新闻及评论,手工构建心态词典,每一次hit,把心态词加加,最后输出主要心态。