论文推介 | 新冠疫情相关社交媒体谣言传播量化分析
2021/10/21 22:00:00 科学传播人

     导读

     2019年出现的新冠肺炎疫情引发大量谣言,在社交平台上广泛传播,这些“信息瘟疫(Infodemic)”不仅严重危害公众生命安全,且易引起社会恐慌和不稳定

     清华大学自然语言处理与社会计算实验室与清华大学新闻传播学院金兼斌教授研究团队合作,研究新冠疫情相关社交媒体谣言传播,成果发表于今年7月出版的《计算机研究与发展》期刊。

     该研究对疫情相关的社交媒体谣言传播展开量化分析,不仅对新冠肺炎疫情相关谣言传播有更全面深刻的认识,同时对突发公共事件的谣言研究和谣言治理,也具一定参考价值。

     论文作者

     清华大学新闻与传播学院教授金兼斌、博士后陈慧敏、硕士研究生林微、朱泽宇,清华大学计算机科学与技术系教授孙茂松、副教授刘知远、博士候选人金思辰、仝凌波、本科生刘一芃、叶奕宁,北京航空航天大学本科生姜维翰。

     内容摘要

     一、研究方法

     研究以2020年1月22日到7月27日期间,新浪微博社区管理中心和举报处理大厅接受微博用户举报疫情不良信息。选择其中受举报并已公示的不实信息数据作为谣言数据,爬取信息数据、搭配人工筛选,构建“谣言数据集”,结合计算机和深度学习,对谣言传播内容、传播者和受众、传播效果进行分析。

     本研究共抓取谣言数据448条,分为病毒传播、病毒信息、疫情防控、国际相关、其他等5类。

     为分析谣言传播者和受众,研究爬取谣言参与用户的基本属性数据(用户认证、关注数和粉丝数等)和历史微博数据(2019年7月31日到2020年7月31日)。谣言传播参与用户分为:辟谣者(举报人)、造谣者(被举报人)、传谣者(转发用户)。造谣者共468人,传谣者1321人,辟谣者1076人。

     为了分析谣言的传播效果,研究爬取谣言的转发和评论数据,共4万5638条(统称为评论)。

     二、研究发现

     (一)

     谣言内容分析

     1.疫情防控类谣言类型出现最多,其次是国际相关类。

     其中“疫情防控”类共226条,占总量一半余,这反映谣言主要围绕公众关心话题领域。国际相关类谣言共206条,大部分涉及“中国人”“国籍”“美国”等民族主义相关词语,主要是因为受众的民族主义情绪获得讨论度和关注度,此外,这类谣言也善于通过迎合人们的认知,来获取认同感、博取可信度。

     2.谣言具有明显阶段性分布特征。

     疫情谣言主要集中在2020年1月到4月,这是国内疫情爆发和国外疫情开始阶段,谣言涉及话题涵盖病毒信息、疫情防控与国际轶事;6月中旬至7月,出现谣言小高峰,主要涉及话题与当时北京两度爆发小范围疫情有关。2020年7月后,基本未再出现新的疫情相关谣言。

     3.谣言涉及地区多为疫情严重地区,且多集中在疫情早期阶段。

     这一方面与疫情初期信息的不确定性有关,公众对疫情的认识十分模糊,另也与疫情初期人心恐慌、不安定因素加剧谣言传播有关。

     (二)

     谣言参与用户分析

     1.造谣者和传谣者历史情绪更为负面。

     文章使用基于BERT与TextCNN结合方式,构建“微博情感分类器”,对造谣者、传谣者、辟谣者三类用户的历史微博数据进行情感分类,结果显示:“造谣者”负面情绪的比例显着高于”传谣者”;传谣者”负面情绪的比例高于“辟谣者”。

     2.辟谣者更偏好新冠科学研究。

     研究发现,辟谣者发布的历史微博中“新冠科学研究”主题占比最高,且显着高于造谣者和传谣者,显示出相对谣言有更强的甄别能力。

     3.辟谣者的自网络聚集系数更高。

     文章以“局域聚集系数(local clustering coefficient)”作为测量用户自网络结构的指标,研究网络属性对谣言用户参与行为的影响,结果显示:“辟谣者“的聚集系数高于“造谣者”;“造谣者“的聚集系数高于“传谣者”,推测辟谣者所处网络更聚集稳定,其关注者间形成一个较为闭合的关注网络。而造谣者和传谣者的自网络结构,则更为松散,这可能使他们的信息获取渠道更开放,但也失去信息源间较为稳定的信任关系,失去信息“交叉验证”机会。

     4.造谣者原创微博字数较多,上午较活跃。

     造谣者偏好发表原创微博,且原创与转发的微博文字数量,都明显比传谣者、辟谣者多;而过往更偏好转发的用户,在接触新冠疫情谣言后,以转发参与传播谣言;与前二者相比,辟谣者发微博数量、发微博字数明显偏低,展现出一种“沉默寡言”的用户形象和“冷静谨慎”的发言姿态。

     (三)

     谣言舆情分析

     1.消极评论多于积极评论。

     研究以情感分类模型分析谣言评论显示,近半数谣言评论持中性态度,反映出相当一部分网络用户对谣言具一定的辨别能力。除中性评论外,消极情感评论数量约为积极情感评论数量的3倍,且在疫情各个阶段都基本占据主导地位。

     2.疫情防控最正面、病毒传播最负面。

     5类主题的谣言评论情感分析,其中疫情防控相关谣言的积极情感评论占比最多,为12.99%,这反映大众对防疫政策的理解和支持。病毒传播相关谣言的消极情感评论占比较多,达44.16%,原因可能是人们对于新冠病毒的传播持有警惕心理,此类谣言容易引发公众恐惧和担忧疫情蔓延。

     3.“药品”和“防疫”相关谣言最受关注,“封城”相关谣言引发积极舆论。

     研究分析频率较高的特色词汇与其相关谣言引发评论:从数量上看,药品类谣言最受关注,转评最多的谣言大多与瑞德西韦有关;防疫则是公众关心热点,相关谣言主要围绕国内外疫情形势。从情感上看,“封城”谣言引发了最多的正面情感,突出湖北为防控疫情的牺牲和奉献。

     总结

     此次新冠肺炎疫情是全球性的突发公共事件,事件的谣言传播研究,对学术和社会治理都具重要意义。本研究从信息传播的基本要素出发,对新冠肺炎疫情相关谣言的传播内容、谣言参与用户、谣言引发舆情,进行详细分析,有助于对谣言传播有更全面深入的认识。

     研究开展的疫情相关社交媒体谣言分析,主要是基于新浪微博社区管理中心中被举报和核查的不实信息数据,难免存在覆盖度不全和人工判断误差,对谣言的判断随着更多信息引入可能会发生变化。因此,该研究聚焦于对疫情谣言传播结构、要素的分析,并未探讨谣言的真实性。

    

     论文链接

     https://kns.cnki.net/kcms/detail/detail.aspx?FileName=JFYZ202107003&DbName=CJFQ2021

     摘录 | 章倩萍

     审阅 | 金兼斌

     编辑 | 李晨雨 张萌萌 朱姿伊

    源网页  http://weixin.100md.com
返回 科学传播人 返回首页 返回百拇医药