谢文:网络舆情大数据挖掘的实现路径

数据挖掘技术在网络舆情引导中的实际应用,我们可以从四个方面来进行探讨。——原成都商报社常务副总编辑、互联网安全与信息化行业管理专业 人士再谈大数据。
  财富成都智库力荐(文:谢文 原成都商报社常务副总编辑、互联网安全与信息化行业管理专业人士小编的话:日前举行的一次互联网行业讨论会上,不少参会专家和业者就互联网 发展趋势及大数据应用、网络舆情科学研判等话题展开了交流,财富成都用户据录音整理如下干货:

  我分享的话题是:大数据挖掘与服务网络舆情的实现路径。

其实, 关于这个话题,业内不少专家都有自己的思考。我印象比较深刻的是,最近在求 是理论网上读的一篇文章,这篇文章应该是互联网安全与信息化专家翟云今年初 发表在《学习时报》上,我觉得很多东西谈的比较深入。

  结合我个人的认识和分析,我认为大数据挖掘与服务网络舆情的实现路径是有规 律可循的。大数据技术的核心技术是数据挖掘技术。要使数据挖掘技术有效助力 网络舆情监测与引导,首先应根据网络舆情演化规律,构建适用于网络舆情挖掘 分析的相关模型和技术方法,使之满足网络等复杂系统中不同舆情对象间的复杂 关系分析,从而为网络舆情挖掘线路与进程提供理论基础,实现一般数据挖掘模 型和技术方法与网络舆情挖掘与分析的有机融合。数据挖掘技术在网络舆情引导中的实际应用,我们可以从四个方面来进行探讨:

  第一个方面,我们先来看一看网络舆情关联分析。

  舆情关联关系是网络舆情数据库中存在的一类重要的、可被发现的知识,首先需 要分析网络事件表征参数间关系,进而发现网络舆情中隐藏的舆情关联。为更准 确表示网络舆情间的关联度,引入网络舆情支持度和网络舆情可信度来量化网络 舆情关联规则的相关性,从而使挖掘结果更准确。如,基于网络舆情关联规则挖 掘,分析新浪微博中活跃者间关联强度、坚定支持者人数以及坚定支持者成员的 变化频度等三个时间序列间的关联规则,挖掘出新浪微博舆情的关联关系,进而为 舆情分析提供重要依据。

  第二个方面,我想谈一谈网络舆情级别划分。

  网络舆情级别划分是根据网络舆情的特征,判断该舆情的严重程度。在对网络舆 情进行级别划分时,首先需要构造网络舆情分类器,然后利用分类器给未知类别 的网络舆情赋予类别。构造分类器的过程一般包括训练与测试两个阶段。在训练 阶段,建立模型描述预定的网络舆情集的特征,集合中的每一条舆情信息都属于 一个预先给定的类别,比如一般严重、严重、非常严重等。利用类标签属性来标 识类别。用于创建模型的网络舆情集一般被称为训练集,可以用数学公式、分类 规则、神经网络或判定树等模型来描述一个预先确定的舆情集合,即进行有监督 的学习。在测试阶段,使用创建的模型在网络舆情测试集上进行预测,并将测试 结果与实际值进行比较,利用测试集中被正确分类的舆情的百分比来估计模型的 准确率。经过以上两个过程,便可以形成性能稳定、准确率较高的网络舆情分类 模型。当新的未知类别的网络舆情出现后,便可以把该舆情的相关信息输入到分 类模型中,然后由分类模型判断该舆情的严重程度。

  第三个方面,我想谈一谈网络舆情聚类。

  网络舆情聚类分析是指,事先不了解网络舆情集合中每一个网络舆情样本所属的 程度级别,是根据网络舆情的主要特征,如舆情发生时间、评论数量、传播频度 等,把相同或相近特征的网络舆情归为一类,从而实现舆情聚类。在舆情聚类过 程中,分在同一个簇里的舆情对象具有很高的相似性,而不同簇中的舆情对象之 间的相似性非常低。所形成的每个舆情簇都可以看作一个舆情类,由它可以导出 规则。与级别划分不同,聚类只对舆情数据进行分析,由于最初并不知道如何开 始,所以训练舆情数据一般不提供级别标记,但是随着聚类过程不断推进,可以 自动给不同舆情簇分配对应的舆情级别标记。

  最后,我想谈一谈网络舆情倾向性分析。

  我们知道,网络舆情倾向性是指网民对客观事物或公共事件所蕴涵的感情、观点 、态度和立场。网络舆情倾向性分析是指通过数据挖掘技术,自动将网络舆情所 包含的褒贬因素挖掘出来,明确信息传播者的真正意图和倾向性。网络舆情倾向 性分析主要包括基于语义的网络舆情倾向性分析与基于机器学习的网络舆情倾向 性分析,目前在技术、方法与模型方面均有深入研究,主要包括序列模式挖掘方 法、情感分析、主题分析等。通过这些技术方法,将网络舆情中丰富的情感倾向 进行定性定量分析,及时掌握网络舆情变化趋势。

  在此基础上,通过对随时间持续变化的舆情进行分析,可以较好地把握网络舆情 的演化规律。

  谈到这里,我的分享也就差不多了。我想再简单回顾一下今天和大家分享的三个 话题:第一部分说的是大数据在网络舆情中的核心价值,第二部分谈的是大数据 在推动网络语气监测服务工作中的四大转变,第三部分谈的是大数据挖掘和服务 网络舆情的实现路径。谈了这么多,大家会不会觉得我谢文认为:利用大数据, 就可以搞定一切网络舆情问题了?

  其实,我个人并不这么认为。我们必须清晰的认识到,网络舆情的纷繁复杂性, 需要我们运用大数据技术进行舆情预测。但是,大数据技术基于计算机的智能运算,只能作为智能化的手段。网络舆情大数据源于互联网的开放、共享,我们不 能仅仅凭借技术构建的大数据平台去打捞那些可能代表一个群体或一定数量级的 沉默的声音。因为如果他们与网络隔绝,或者由于沉默的螺旋心理效应,而不提 供任何数据,那么我们所精心分析出的网络舆情实际上是不全面的,以此来指导社 会管理是有偏差的。

  所以说,面对越来越繁重的网络舆论服务工作,固守以往传统工作方式将愈来愈 力不从心。但完全寄希望于大数据技术来当成网上舆论服务和引导的万能钥匙, 解放人的辛苦劳动,无疑将是天方夜谭。

  大数据技术是人发明的,它只是个手段,永远不能离不开人的把控和分析。

  谢谢大家!

  (发言者简介:谢文/原成都商报社常务副总编辑、互联网安全与信息化行业管理专业 人士。以上文字据录音整理,未经当事人校核。)
您可能还感兴趣的文章

参与讨论,请先登录| 注册

新浪微博快速登录腾讯QQ快速登录

文明上网,理性评论 | 欢迎您,
网友评论仅供其表达个人看法,并不表明财富成都立场。 
最大支持255个中英文字符 
全部评论() 最新评论
官方微信
微信扫描二维码
获得每日精选资讯
官方微博

更多>>最新资讯
社会内卷的真正原因是啥?
社会内卷的真正原因是啥?

内卷这个概念的内涵很丰富,与我们的生活息息相关。为了普及和传播知识,我参考了相关的信息,把我个人的粗…

为什么90后、00后不服管?可…
陈春花:企业需要具有增长型思维…
沈南鹏:带着公益心去投早期
科创板公司参与设立产业基金 上…
迪士尼为何能不断打造深受喜爱的…

广告位空缺中,如有需求请联系站长

更多>>热门资讯
5G时代的通信会有哪些颠覆性创…
5G时代的通信会有哪些颠覆性创新?

对于行业来说,5G+也许会带来很好的投资机会。

寒冬?产业互联网的春天才刚刚开…
史玉柱:所谓的“成功学”,都是…
数字化时代,管理者最重要的事情…
制造业要不要来西部?
大数据营销不能自作聪明!
推荐服务Recommend Service
深入财富成都
创业交流
交流站
案例
人物
故事
新蓉商
智库分享
专栏
TA说
分享
成都头条
快报
奢华人生
热点话题
读图
财富论坛
最新动态
关注500强
孵化器
官方发布
天府新区
天府快讯
政策
组团
会员服务
智慧社区
推荐服务
合作伙伴
帮助中心
关于我们
RSS订阅
网站地图
加入我们
寻求合作
寻求报道
常见问题解答
投资项目库快捷导航
[{"url":"http:\/\/www.chengduvip.cn\/","img":"http:\/\/chengduvip.cn\/data\/upload\/photo\/Banner\/2022\/11\/b\/638079e33bb0f.png"}]