成都理工大学论坛

 找回密码
 注册(开放注册)
搜索
查看: 52089|回复: 0
打印 上一主题 下一主题

有偿诚寻擅长“自然语言处理”的同学,做部分新闻文本情绪分析

[复制链接]
跳转到指定楼层
1#
发表于 2020-2-20 20:15:37 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
具体需求:二、  文本采集与情感分析
(一)  文本挖掘(爬虫或八爪鱼)
1.对象:澎湃新闻
2.抽样平台:澎湃新闻官方网站(澎湃新闻粉丝略胜一筹)
3.时间:2019.12.7—至今
3.关键词:华南海鲜市场、肺炎、新冠肺炎、新型冠状病毒肺炎、肺炎病毒
(二)挖掘类目
1.发文数量(总量、每天发文量及变动状态)
2.消息来源:原创/转载(转载来源)
3.报道类型:消息、通讯、深度报道、评论文章、其他
4.情感分析:
(1)情感指标搭建:目前大部分研究对情感分析采取二元(正、负)或三元(正、负、中),

情感倾向  情绪类型
积极情感  认可、期望、喜悦、敬畏、感动
消极情感  恐惧、质疑、担忧、反对、愤怒、悲哀
中性情感  惊讶
(2)新闻文本主题建模
模型以snowNLP提供的朴素贝叶斯文本倾向性算法为基础,[0,1]情感值,情感值越接近0表示情感越负面,情感值越接近1越正面。
得出表一:情感分析统计表
表二:情感倾向总表(正面情感新闻文本数量,其中认可、期望、喜悦、敬畏、感动情绪文章各自的数量)(负面情感新闻文本数量,其中恐惧、质疑、担忧、反对、愤怒、悲哀情绪文章各自的数量)(中性情感新闻文本数量,惊讶情绪文章的数量)

表三:每日情感倾向表(每日情感的变动)
表四:新闻文本的主题及关键词词云图
主题:  
表五:正/负/中性情感主题内容
您需要登录后才可以回帖 登录 | 注册(开放注册)

本版积分规则

手机访问本页请
扫描左边二维码
         本网站声明
本网站所有内容为网友上传,若存在版权问题或是相关责任请联系站长!
站长联系QQ:7123767   myubbs.com
         站长微信:7123767
请扫描右边二维码
www.myubbs.com

小黑屋|手机版|Archiver|成都理工大学论坛 ( 琼ICP备10001196号-2 )

GMT+8, 2024-5-17 11:57 , Processed in 0.263092 second(s), 14 queries .

Powered by 高考信息网 X3.3

© 2001-2013 大学排名

快速回复 返回顶部 返回列表