《重大突发事件舆情风险点预测研究报告.docx》由会员分享,可在线阅读,更多相关《重大突发事件舆情风险点预测研究报告.docx(12页珍藏版)》请在第一文库网上搜索。
1、重大突发事件舆情风险点预测研究报告1 .引言随着互联网技术发展和自媒体应用推广,重大突发事件发生后,其舆情信息呈爆炸式级数增长。此时,若所传播舆情信息中涵盖谣言等虚假信息,极易产生舆情风险,影响社会稳定。例如,新冠肺炎疫情暴发以来,疫情相关舆情信息在互联网平台持续发酵、裂变扩散,所涉疫情谣言散布恐慌情绪,甚至妨碍抗疫进展。在各类重大突发事件发生后的第一时间,尚未产生舆情风险之前,有经验的管理者或突发事件研究专家,凭借历史突发事件处理经验,可感性预知一些显性的舆情风险点。但是,由于突发事件发生和风险传播过程受多种复杂因素共同作用影响,随舆情演化,那些衍生的、潜在的、隐藏的舆情风险点则不易在第一时
2、间察觉。关于重大突发事件舆情风险的相关研究主要包括以下三个方面:一是舆情风险的监测预警。监测研究通过突发事件类型设定关键词进行全网监测,或通过锁定特殊网站进行实时监测;预警研究通过“敏感内容”预警或“风险等级”预警,构建舆情风险等级评定指标体系,明确舆情风险低、中、高等不同等级提前预警;进一步的研究利用随机Petri网与同构马尔科夫链对各级风险指标交互关系进行分析,为预控决策提供定量参考。二是舆情风险的等级评价。主要测度舆情带来的负面社会影响,基本都是通过构建评价指标体系实现,但在构建指标体系时各有侧重,包括考虑意见领袖作用、考虑首发信息因素、考虑舆情演化周期等。在具体的评价方法上主要包括层次
3、分析法、模糊综合评价法、BP神经网络法等,创新的方法包括加速遗传算法(AGA)与投影寻踪相结合(PP).直觉模糊ChoqUet积分法、UM1法、因子聚类法等。三是舆情风险的感知识别。主要从普通民众的角度,分析个体在遇到突发事件时风险感知的影响因素,例如时空动态特征、情绪状态、心理健康水平、传播媒介和信息一致性的影响等;也有研究从决策者的角度,运用前景理论分析舆情传播中决策者处理公众风险感知时的偏好行为,为通过应急资源调度手段控制资源抢购事件的发生提供理论支持。可以看出,以上研究多是从“为今之计”的视角,针对当前所发生的具体突发事件开展研究。本研究则是从“以史为鉴”的视角,以历史突发事件为抓手,
4、通过分析新发生突发事件与历史突发事件的相似性,预测新发生突发事件可能衍生的所有舆情风险点。具体的,以我国20x-2OXX年十余年的近五万件历史突发事件数据集为基础,通过深入剖析这些突发事件的文本数据,识别出突发事件中易引发舆情风险的各类风险点,并对这些风险点做共现分析;然后,应用特征相似度算法,计算新发生突发事件与历史突发事件的相似性,判断新发生事件与历史突发事件的关联关系,进而定量预测新发生突发事件可能衍生的所有显性的和隐性的舆情风险点。综上,本文从舆情风险源头治理的视角,研究如何在潜在风险萌芽时期,尽早洞见风险预控关键点,以期在舆情爆发前或舆情产生后的第一时间迅速对突发事件舆情进行响应,从
5、而掌握舆情处置的主动权和话语权。2 .历史突发事件风险点识别当突发事件舆情传播过程中涉及风险点(或敏感词)时,不断刺激公众脆弱神经,更易吸引民众关注,进而产生抱怨或消极情绪。例如20xx年X月引起舆情大爆发的问题疫苗事件,是由X月XX日XX新闻刊发的XX,“杀人”字眼引发公众关注,舆情迅速蔓延,然而早在X月XX日,XX社刊发了题为XX的新闻,但此标题并没有引起舆论发酵。针对突发事件信息,权威官方媒体报道基本实事求是、客观公正,但“两微一端”的自媒体,包括各种新闻客户端APP,或对事件认知存在偏差,或为抢流量故意为之,其新闻标题文案中的部分“吸睛”字眼,常成为引爆舆论场“风险点”和引发舆情危机的
6、“助燃剂”。数据采集和处理研究团队自20xx年起关注中国各地区突发事件发生情况。通过计算机自动采集方式,每日定时监测国内人民网、新华网等主流新闻网站和新浪、网易、搜狐等门户网站,基于突发事件关键词检索发生在国内各地区的重大突发事件情况。其中,突发事件关键词提取自四类突发公共事件,如自然灾害事件关键词包括地震、灾害、泥石流、沙城暴等;事故灾难事件关键词包括爆炸、空难、核事故等;公共卫生事件包括传染病、疫情、中毒等;社会安全事件关键词包括纵火、暴乱、砍杀等。所采集的突发事件数据信息包括事件名、事件类型、事发时间、事发地点、死伤人数等。进一步对自动采集的数据进行重复信息去重、错误信息删除等人工处理后
7、获取每日突发事件数据。自20xx至今十余年,我国各地区共发生各类突发事件近X万件。从突发事件类型来看,事故灾难类突发事件占比最高(XX.X%),主要包括交通运输事故、工矿企业生产安全事故;其次是自然灾害类突发事件(xxx%),主要包括气象灾害、地震灾害、地质灾害等;然后是社会安全事件(x.x%),包括集体械斗、打砸抢烧、恐怖袭击等社会舆论聚焦的热点事件;最后是公共卫生事件(xx%),主要涉及食品安全、传染病疫情等突发事件(图X)。舆情风险点识别通过对近年来发生的重大突发事件舆情信息传播内容做文本分析,结合专家经验,识别筛选出一些易引起舆情爆发的风险点(以RRii表示)共XX个(图X)。例如,关
8、联人身安全的“死亡”(RRXX=XXXx)、“自杀”(RRXX=XXx)、“杀人”(RRXX=XXX)、砍杀(RRxx=xx)等;易引起弱势群体关注的“强奸”(RRXX=XX)、“讨薪”(RRxx=xx)、“猥亵(RRXX=XX)等;易引发群体性恐慌的“污染”(RRXX=XXX)、“疫情”(RRXX=XXX)、病毒(RRX=XX)等(括号中数字为对应风险点在历史突发事件标题中出现的词频)。3 .历史突发事件风险点共现分析事物的关联性可从多角度分析,其中“共现分析”是一种有效的分析方法。共现分析认为:事物的相互联系是共现发生的内在原因,而共现现象是事物相互联系的外在表现,通过分析共现现象可以了解
9、事物间联系的强弱和关联类型。应用共现分析研究不同风险点的关联情况,两个不同的风险点共现的频次越多、共现率越高,说明两个风险点之间的关系越密切。本文应用共现分析研究不同风险点的关联情况,首先基于大量历史突发事件识别突发事件的风险点,然后建立风险点共现矩阵。本研究进一步选取Jaccard共现率指数对所建立的共现矩阵进行分析,并构建不同风险点共现关系网络。风险点共现矩阵检索以上所识别出的XX个突发事件舆情风险点在不同历史突发事件舆情信息新闻或热点话题标题中的出现频次,得到一个XXXXX的对称矩阵。检索结果的部分数据如表X所不O在风险点共现矩阵中,对角线的数值为XX个风险点在所有历史突发事件中的词频,
10、非对角线上的数值则表示行和列对应的突发事件同时出现一个风险点的词频。风险点共现关系网风险点共现矩阵可以直接反映两两风险点的出现频次,但只是一种简单的表象,因为真正的共现关系还受两个风险点各自频次的影响。应用共现率计算指数,将共现矩阵转化为相关系数矩阵,进一步揭示不同突发事件风险点之间的结构关系。本文应用JaCCard指数xx,xx对不同风险点之间的紧密程度进行度量。通过JaCCard指数的测算,可使两个本来关系就密切的风险点显现得更密切,使关系疏远的风险点则更疏远(表x)。JaCCard指数计算公式如下:其中,JJiijj表示风险点讥和风险点力的共现率,且x77x;CCiijj表示风险点ii和
11、风险点力.的共现频次;CCii表示风险点ii的频次;ccjj表示风险点力的频次。基于以上所得风险点之间的共现率结果,构建风险点共现关系网络模型。其中,“节点”表示XX个不同的风险点,“节点的权重”表示对应风险点出现的频次;“连边”表示不同风险点之间的共现关系,“连边的权重”则表示共现关系紧密程度,即共现率。具体的共现关系网络如图X所示。应用网络结构指标对共现关系网络进行度量,发现:节点平均连接度为x.xxx,其中风险点“死亡”的连接度最高,与其他XX个风险点具有连接关系;其次是风险点“自杀”和“持刀”,分别与其他XX个风险点具有连接关系:模块化指标为X.XXX,根据网络结构分为四个模块,模块X
12、主要指关联生命财产安全的风险点,模块X主要是严重违法犯罪活动的风险点,模块X主要是引发群体性事件的风险点,模块X则主要是公共卫生事件相关的风险点;网络密度为X.XXX,平均聚类系数为X.XX,说明突发事件舆情风险点之间的关联关系紧密。4 .新发生突发事件风险点预测新的突发事件发生后的第一时间,其事件的基本属性特征可以获取,包括事件类型、事发时间、事发地点、人群类型、死伤人数、经济损失等。此时还未爆发大规模舆情,其舆情风险点是未知的。历史突发事件的舆情传播已经结束,事件的基本属性特征和对应的舆情风险点则都是已知的。本文通过计算新发生突发事件与历史突发事件集中所有事件的属性特征相似性,建立起新发生
13、突发事件与历史突发事件的定量关联关系,进而判断新发生突发事件随舆情演化可能产生的舆情风险点。新发生事件与历史事件的相似度为建立新发生突发事件与历史突发事件之间的关联关系,本研究提出突发事件的特征相似度算法,通过度量新发生突发事件与历史突发事件在各属性特征的相似性,定量两者之间的关联关系。特征相似度算法基于相似案例分析的决策范式,将新发生突发事件设为目标案例NN”7,已发生突发事件归为历史案例集PP,进而采用最近邻法(K-nearestapproach:K-NN)20中的相似度计算方法,即通过目标案例与历史案例各属性特征的相似程度与属性特征权重WW/的乘积来实现。具体如下:Sim(NN”7,PP
14、)=wwjjSSiimmjj(W,7,PPii)(2)其中,SinI(NN”7,PPii)表示目标案例NN7所对应的突发事件与历史案例PPii的相似程度,Sim(NN”7,PPiD0,1,该值越大,说明两个案例之间的相似程度越高,即两个案例之间具有紧密连接关系的可能性越大。PP=PP1,PP2,PPii,其中PPii表示第讥个历史突发事件案例,UMMo设CC=CC1,CC2,,CCm为突发事件属性特征集,其中CC表示第力个属性特征,/NN。WW=ww,ww,,Ww表示突发事件属性特征权重向量,其中WW/表示属性特征CCi/的权重,即该属性特征CC力的重要程度,满足Ww/NO且EjjeNNWWj
15、j=1。根据领域专家经验判断,本研究设定突发事件属性特征权重向量为WW=x.XX,X.XX,X.XX,X.XX,X.XX,X.XX,X.XX,x.xx),根据不同研究需要,以上属性特征权重向量可动态调整。属性特征提取本研究将突发事件属性特征集CC分为符号型和数值型两种:“符号型”属性特征包括事件类型(CCI)、事发时间(CC2)、事发地点(CC3)、人群类型(Ce4);“数值型”属性特征包括涉及人数(CC5)、死亡人数(CC6)、受伤人数(CC7)、经济损失(CC8)。以上八类属性特征的具体内涵如表3所示。针对符号型和数值型属性特征的计算公式如下:当属性特征CC力为符号型时,SSiimmjj(
16、W,7,PPiD的计算公式为1,jj-yyiIjjSSiimm(NN,7,PP)=,iiMM,力.WNN/性特征,力NNWW-ww9ww,ww表示力UO9%jjyyii/在以上公式中,征值。具体实例应用为展示具体计算过程,本文选取我国近十年来发生的XX起重大突发事件作为历史案例,选取20xx年发生的“xx化工厂爆炸”为目标案例。基于以上提出的突发事件特征相似度算法,将“xx化工厂爆炸”作为目标案例NNx,将XX起历史突发事件作为历史案例集PR然后计算目标案例与历史案例的相似性程度,建立目标案例与历史突发事件之间的关联关系。该目标案例NN7与历史案例集PP中历史突发事件的具体属性特征如表X所示。依据特征相似度算法公式(x)至公式(x),可以计算目标案例NATx与历史案例PP