科技与社会|基于微博数据的“新冠肺炎” 互联网舆情分析

摘 要:新浪微博作为国内互联网最主要的舆情发酵源头和热点事件聚集地之一,是监测互联网舆情动态,洞察舆论观点不可或缺的重要平台。本研究聚焦新浪微博“新冠肺炎”热点事件,从科技话题、科研机构、科技人物、热点事件等不同维度进行数据挖掘,结果表明,一是政府、科研机构、科技工作者等各级社会组织和个人迅速参与“新冠肺炎”热点事件讨论,推动各级政府积极协调动员社会各方资源。二是社会公众高度信任政府、科研机构和领域专家等权威主体的舆论引导,其应激情绪也深受权威媒体言论影响。三是要进一步提升我国“应急科普”能力,创新科普宣传理念,树立科协品牌价值,引导舆论正向发展。
关键词:新冠肺炎,微博数据,舆情,高频词
2020年1月新型冠状病毒感染的肺炎疫情爆发后,引发了社会各界的高度关注。为确保有效控制疫情蔓延,顺利推进全国范围内的“疫情防控、复工复产”工作,开展正确的疫情防控知识宣传、了解全国民众对“防疫”“复工”的观点意见、洞察群众舆论导向至关重要。本研究选择8家微博与“新冠肺炎”相关的热点微博内容和用户评论情况进行统计分析。利用数据挖掘等技术,抓取典型事件的微博评论内容,并对相关热点科技事件进行分析,开展基于微博数据的“新冠肺炎”互联网科技舆情专题分析研究。
1. 数据来源与方法
新浪微博是国内最主要的互联网社交媒体之一,拥有2.2亿日均活跃用户。研究选取2019年12月1日至2020年2月12日期间与“新冠肺炎”相关的热点微博内容和用户评论情况进行统计分析。在综合考量媒体公信力、影响力和专业化程度之后,从权威媒体、科技媒体和卫生健康媒体中选取8家微博(人民日报、央视新闻、科普中国、科学探索、知识分子、科学网、健康中国、丁香医生)作为本研究的分析对象。
2. 数据分析
围绕与“新冠肺炎”相关的高频科技热词和热点科研机构、科技人物、科技事件,展开数据分析。
2.1 高频科技热词分析
结合多个医疗健康领域的专业词典及对微博信息的分词研究、经多次迭代,对出现10次以上的高频专业词汇(138条)和出现50次以上的非专业高频词(153条)进行统计整理,发现:一是在医疗卫生健康专业领域,社交网络用户对“新冠肺炎”的关注焦点在疫情预防、发病后诊断及治疗方面。“口罩、防护服、体温”等词汇出现频次明显高于“病源来源、宿主传播机制、核酸检测”等专业词汇。二是在非专业领域公众关注焦点在省份、机构和职业群体方面,民众获取信息的主流渠道如新闻消息、报告、专业建议和应对措施等也是关注和讨论的重点。“新冠肺炎”高频专业术语(图1)和高频词(图2)词云图如下。

科技新一微博

科技新一微博

2.2 热点科研机构分析

热点科研机构统计分析发现,本次疫情的应对工作聚集了以中国疾控中心为首的包括中国科学院、中国工程院、高校和军队科研院所等国内顶尖医疗卫生研究机构。同时,以世界卫生组织为首的国际科研机构也参与了研究工作。值得关注的是,在积极开展疫情防控科研攻关的同时,与疫情相关的科普宣传和心理干预工作也全面开展,如以中国科协为首的国内应急科普先锋力量和以中科院心理研究所为代表的心理辅导力量(图3)。

科技新一微博

进一步对发布内容进行清洗和统计发现,围绕着“病毒”和“疫情”这两个高频核心词,院士、专家和医生形成重要的科研力量,机构攻关集中在患者医治、药物研制、疫苗研发、传播方式研究和病毒快速检测等方向(图4)。

科技新一微博

2.3 热点科技人物
热点科技人物统计分析发现,本次事件热点科技人物不仅包含诸多院士,还有大量普通科技工作者及医务人员(图5)。

科技新一微博

将院士和热点事件进行关联(图6),发现:在重大疫情前,院士们率先垂范、积极发声,在疫情攻坚中起到了中流砥柱作用,如钟南山、李兰娟等院士;也有院士致力于药物研究、疫苗研发,如陈薇、蒋华良、陈焕春等院士;还有院士通过捐款等方式,为战胜疫情贡献自己的力量,如钱七虎等院士。

通过对热点有关的科技人物、科研机构分析发现,社会各主体对应急事件的响应迅速:科研机构在事件中反应及时,调动科研资源,集中力量攻关;领域专家身先士卒,为疫情防控作出重要贡献;社会公众参与度高,积极推动政府投入和调动社会各方资源用于控制解决应急事件。
2.4 热点科技事件
围绕与“新冠肺炎”密切相关的科技类热议事件及话题,结合网民的重大关切和心理健康需求,选取3个科技类热议话题、1个民生类热议话题和1个心理健康类热议话题,通过对高频词的相关性分析,结合微博表情对用户心理、情绪的表征,开展基于微博数据的“新冠肺炎”热点科技事件案例研究。
热议事件一:发热咳嗽非新冠肺炎唯一首发症状(简称“非唯一症状”)
选取话题中出现频次大于200的相关词语制作词云图(图7),可以看出,围绕报道中提及的新冠肺炎并非以发热咳嗽为唯一首发症状,如“胸闷”“头疼”“发烧”“咳嗽”等其他感冒症状和“害怕”“惊吓”“恐惧”等负面描述被提及并热议。

科技新一微博

为更好地揭示和挖掘高频词之间的关系,将出现60次以上的词语(338个)制作成热力图(图8),可以明显发现“自己”“感觉”“症状”“医院”,及一些具体症状如“发烧”“头疼”“感冒”“心慌”等词语形成了多个热力中心,反映出受疫情影响和对报道内容的联想,用户恐慌情绪明显。

科技新一微博

性别分析发现,在“非唯一症状”话题中,女性用户相较男性用户使用表情包表达情绪的意愿更加强烈(约为男性的10倍),也更加悲观(图9)。

科技新一微博

地域分析发现,在数据截取时段、即2月中旬之前,基本以悲观情绪为主。发表评论用户数最多的分别为广东、湖北、北京、江苏和四川。
热议事件二:深圳确诊患者粪便中检出病毒RNA阳性(简称“粪便检出病毒”)
选取话题中出现频次大于100的相关词语制作词云图(图10),围绕报道中提及的粪便中可检测出病毒RNA呈阳性,如“口罩”“感染”“传播”等病毒的传播和防疫手段,以及“粪便”“厕所”等可能的与病毒传染路径相关的名词成为热词。

科技新一微博

将出现50次以上的词语(334个)制作成热力图(图11),可以看出围绕“我们”“病毒”“粪便”等热力中心,与粪便传播和防疫相关的词语被较多提及,针对潜在的病毒传播途径的讨论和预防成为关注的重点。
性别分析发现,男性用户相较女性用户情绪更加稳定和乐观(图12)。

科技新一微博

科技新一微博

地域分析发现,各地对表情包的使用呈现多样化。发表评论用户数最多的分别是广东、北京、山东、江苏和四川。
热议事件三:特别提醒:请勿抢购自行服用双黄连口服液(简称“双黄连”)
选取话题中出现频次大于500的相关词语制作词云图(图13),可以看出,围绕官媒对双黄连口服液可有效抑制病毒的报道,“抢”“抢购”“哄抢”等不理智的购买行为和对“官媒”“媒体”“新闻”等误导群众而带来的负面影响的抨击成为热议的话题和主流观点。
将出现200次以上的高频词(398个)制作成热力图(图14),可以看出围绕“双黄连”“抑制”“预防”等报道内容,网民对“官媒”“媒体”报道的“权威”性和“责任”意识产生信任危机,对哄抢行为表示否定和质疑,事件的总体情绪和用词以否定词和贬义词为主。

科技新一微博

科技新一微博

对评论中所使用表情包的情绪分析来看(图15),虽然“微笑”表情的数量排名第一,但这一表情不具备明确的指示性含义。值得注意的是,“怒”的表情的选择人数明显高于其他事件,反映出用户对官媒报道不谨慎、不负责的极大愤怒和不满,“二哈”“doge”和“摊手”等表情包则反映了用户对媒体报道不严谨而引发的后期辟谣的无奈和嘲讽态度。疫情当前,严谨、负责的态度是媒体发声的前提。

科技新一微博

地域分析发现,大多省份以“微笑”为主,辽宁、天津等地则以“怒”居首位。各省评论用户数最多的分别是广东、北京、江苏、浙江和四川,山东、上海、河南、湖北、陕西、福建、河北等地区评论人数也均超过1000,“双黄连”话题引发全国热议。
热议事件四:企业复工复产和延迟复工工资的政策(简称“复工”)
整合人民日报在2020年2月7日发布的“人社部:春节延长假期间上班先安排补休”和2月8日发布的“延迟复工工资发放新政策”两条微博,选取出现频次大于500的相关词语制作词云图(图16),“上班”“工资”“老板”“公司”等经济类相关词语成为关注焦点,“口罩”“隔离”“疫情”等影响复工的重要因素也被多次提及。

科技新一微博

将出现150次以上的高频词(369个)制作成热力图(图17),可以看出“工资”“上班”“企业”“老板”等重要企业生产活动的影响因素成为关注的焦点,企业停工造成的损失、停工期间工资的发放问题、上班期间的个人防范措施以及相关的调补休、加班等话题引发大家的关注和讨论。
基于表情包的情绪分析发现(图18),在排名第一的“泪”表情包中,女性数量远高于男性,悲观情绪较为明显,而男性使用的表情包更多的是“允悲”“微笑”“二哈”“doge”一类的反映尴尬和无奈情绪的表情包。

科技新一微博

为更好地分析企业的微观心态,针对“复工”话题评论用户的身份进行识别和筛选,选择中层以上人员(职位包括:总监、CEO、经理、部长等)的微博进行表情分析,发现企业中高层的情绪与大众基本保持一致,“泪”表情占居首位,其次分别是“微笑”、“允悲”和“摊手”。
地域分析发现,大多省份以“泪”和“允悲”为主,各省评论用户数最多的依次是广东、北京、江苏、浙江、山东、上海和四川,评论数均超过1000条。
热议事件五:心理健康方面聚焦“总怀疑自己得病怎么办?”(简称“心理健康”)
选取话题中出现频次大于200的相关词语制作词云图(图19),可以看出,对可能患病的感知如“觉得”“感觉”“怀疑”等词出现频率较高,与“新冠肺炎”临床表现相关的症状如“咳嗽”“发烧”“体温”“感染”等词也被多次提及,由此而产生的如“吓”“害怕”“死”等负面主观心理活动较强。
将出现100次以上的高频词制成热力图(图20)可见:由于对未知事物的恐惧和自我怀疑,人们的负面恐慌情绪较强,心理压力较大。
性别分析显示(图21),“女性对自身可能患病的恐慌和担忧明显高于男性,女性的多愁善感的心理活动得到了充分体现。总体来看,男性的抗压力远大于女性,但也可能和男性不善于用表情包表达情绪有一定关系。

科技新一微博

科技新一微博

地域分布显示,各省使用最多的表情包是“允悲”,发表评论用户数量前五的地区分别是广东、北京、江苏、四川和山东。为进一步探究和细化各地区人民心理健康情况,对市县级用户的评论数据进行统计发现(图22),武汉市位列市级第三位。湖北省作为本次“新冠肺炎”疫情爆发的中心,在省级层面评论总数未能进入前五,需要指出,受网络环境、重视程度和地域品牌认同等因素影响,分析结果与传统认知可能会存在一定差异。

科技新一微博

3. 结论与建议
基于对“微博信息+评论内容+用户画像”等综合分析,从社交媒体“新浪微博”中挖掘与“新冠肺炎”相关的科技类舆情信息,聚焦科技话题、科研机构、科技人物、热点事件解读等,得出结论并提出建议。
一是政府、科研机构、科技工作者等社会组织和个人对“新冠肺炎”热点事件讨论的参与度很高。民众反应迅速,可在短时间内形成舆论推动各级政府积极协调动员社会各方资源。但从整体来看,我国应急预防系统仍存在一定缺陷:首先应急物资储备不足,无法及时应对突发事件;其次,现有应急预案体系中,更侧重于突发事件发生后的解决和控制,而缺乏对事件发生前的预判和对早期发展情况的把控。建议国家层面不断完善我国突发事件应急管理体系,建立健全应急响应机制,进一步提升我国政府综合应急能力。
二是政府、科研机构和科学家具有较高的声誉和权威性,其发布内容会给社会舆论带来重大影响。社会公众高度信任政府、科研机构和领域专家等权威主体发布的信息,其应激情绪也深受权威媒体言论影响。建议要充分发挥政府、科研机构和科学家权威性引导消除社会公众的敏感和非理性行为。要强调政府、科研机构科普责任意识和科技工作者的担当精神,通过润物无声、接地气的科研成果和科研解读,促进民众对科技进展的建立正确认知,满足民众科普需求,推动科技便捷生活服务与应用。
三是提升我国“应急科普”能力,创新科普宣传理念,树立科协品牌价值。社交媒体是公共事件的发酵池,也是影响舆情的双刃剑。对突发事件及时、正确、权威的官方解读将给事态的进一步发展和社会舆论带来更多的正向反馈。以中国科协为例,需主动加强与主流新闻媒体和自媒体的合作互动,开通并妥善管理利用科协及各级学会社交媒体账号,及时更新,实时发布,以高效、全面、可靠的权威信息发布,推动提升科协在突发科技事件中的话语权和影响力。

作者简介:

高 洁,女,硕士,助理研究员,中国科协创新战略研究院,研究方向为政策量化研究分析。

杨宝龙,男,硕士,工程师,中国科协创新战略研究院,研究方向为数据挖掘与分析、机器学习、科技与经济融合。

赖思宇,女,硕士,实习研究员,中国科协创新战略研究院,研究方向为国内外经济政策的比较研究。

武 虹,女,硕士,高级工程师,中国科协创新战略研究院,研究方向为信息技术。

赵立新,男,博士,副院长,中国科协创新战略研究院,研究方向为科技评估、科普理论研究。

杨逸萌,男,本科,助理工程师,中国科协创新战略研究院,研究方向为信息技术。

大家都在看

相关专题