网络舆情监测分析系统
产品白皮书
北京融汇画方科技有限公司
2012.09
版权声明
北京融汇画方科技有限公司版权所有,并保留有对本文档及本声明的最终解释权和修改权。 本文档中出现的任何文字叙述、文档格式、插图、照片、方法、过程等内容,除另有特别注明,版权均属北京融汇画方科技有限公司所有,受国家有关产权及版权法保护。任何个人、机不得以任何方式复制或引用本文档的任何片构未经北京融汇画方科技有限公司的书面授权许可,段。
画方科技是北京融汇画方科技有限公司的注册商标,受商标法和有关国际公约的保护。
免责条款
画方科技公司在本文中尽可能提供确定的信息,但不会为信息的完整性和正确性承担责任。除非有书面协议,本文所述画方科技公司的产品信息并不代表任何保证或正式的承诺。更多的资料可以向画方科技公司索取。
支持信息
本资料将定期更新,如欲获取最新资料,或更多画方科技相关产品信息、解决方案以及其它网络、信息安全相关的软、硬件产品信息,敬请访问画方科技公司网站: http://www.huafoun.com ,或发送电子邮件到 product@huafoun.com ,或致电画方科技垂询。
北京融汇画方科技有限公司
地址: 北京市海淀区花园路13号汗太华大厦三层 邮编:100021 电话:86-10-84928311 传真:86-10-84828038
网络舆情监测分析系统产品白皮书
目录
1 2
背景................................................................................................................................................... 4 系统概述........................................................................................................................................... 4 2.1 产品理念............................................................................................................................... 4 2.2 工作流程............................................................................................................................... 5 2.3 产品意义............................................................................................................................... 6 产品功能........................................................................................................................................... 6 3.1 舆情规划............................................................................................................................... 6 3.2 舆情信息采集 ....................................................................................................................... 6 3.3 舆情信息加工 ....................................................................................................................... 7 3.4 元搜索功能........................................................................................................................... 8 3.5 舆情专题............................................................................................................................... 8 3.6 舆情分析............................................................................................................................... 9
3.6.1 舆情分布图 ............................................................................................................... 9 3.6.2 舆情趋势图 ............................................................................................................... 9 3.7 舆情报告............................................................................................................................... 9 3.8 分级权限管理 ....................................................................................................................... 9 3.9 用户管理............................................................................................................................... 9 3.10 关键字管理......................................................................................................................... 10
3.10.1 事件关键字管理 ..................................................................................................... 10 3.10.2 领导人关键字管理 ................................................................................................. 10 3.10.3 色彩关键字管理 ..................................................................................................... 10 3.11 手工添加舆情 ..................................................................................................................... 10 3.12 舆情报警............................................................................................................................. 10 3.13 智能终端............................................................................................................................. 11 系统特点......................................................................................................................................... 11
3
4
第 3 页 共 12 页
网络舆情监测分析系统产品白皮书
1 背景
当今,互联网世界已经渗透到现实社会的各个角落。极大的扩大了人类实践活动的范围。且互联网世界的开放性和匿名性使得人们更亲睐于通过网络来表达自己的内心世界,更直接更坦诚的发表观点。在互联网快速发展的今天,网络媒体已经成为一种信息的主要传播途径,其开放、虚拟的特性让言论达到了前所未有的活跃程度。在论坛、博客、微博等非受控渠道是目前发表个人观点的主要方式。
我们在受益于互联网世界的同时,也会为因此产生的网络忧患而担忧。互联网是先进文化供给与传播的重要手段,是反映社会舆情的主要载体之一,是网络舆情产生的聚集地,却也是危机事件引发的根据地。对于公众关注的事件很快就会形成网上舆论,个别人在其中煽风点火,极易造成网络非理性情绪蔓延,进而产生严重的不良影响,对相关部门造成巨大的舆论压力。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。
2 系统概述
画方科技舆情监测系统一共包括三个模块:网络舆情采集系统、舆情分析引擎和舆情应用服务系统。提供相关舆情、负面舆情、预警信息、热点信息的发现、主题事件监测、分类监测、舆情监管、统计分析、辅助决策支持等多层次、多维度的舆情信息服务。根据用户的网络舆情监测和定向追踪等信息需求,形成简报、报告、图表等分析结果,从而帮助用户及时掌握舆情动向。为领导和舆情工作部门提供信息参考和决策支持。
对不同政府、企业和行业监管等职能部门而言,舆情监测的需求既有通用性,也有个性化的特点存在,画方科技舆情监测系统具有极大的扩展性,凡是需要对舆情、口碑关注的政府、企业、高校和其他组织机构都可以通过本系统进行量身打造,建立适合自己的舆情监测体系。
2.1 产品理念
“及时发现”是舆情监测系统的核心功能,效果是舆情监测系统的灵魂
第 4 页 共 12 页
网络舆情监测分析系统产品白皮书
定向采集和全网搜索相辅相成,按照舆情的传播规律构建立体监测体系,疏
而不漏
管线架构,舆情漏斗分析模型,分析粒度粗细可控 技术结合实践,千锤百炼,功能设计实用至上
在舆情监测领域,普遍存在着产品功能与客户需求之间的差距,很多公司回
避这个难点,不再提倡舆情监测的概念,而是当做一个大而全的管理系统去做。我们认为,现阶段,舆情工作的重点仍然是舆情监测,提供及时、全面、准确的舆情监测是舆情监测系统的灵魂。不抓住这一灵魂,也就失去了舆情监测在现阶段存在的意义和作用。因此,我们做舆情的产品理念就是:按照舆情的传播规律构建监测体系,立体监测、及时更新、准确分析、合理展现。真正起到舆情监测的作用,提高舆情应对和管理的质量和效率,为舆情管理和领导决策服务。
2.2 工作流程
(1)信息采集系统从互联网上采集新闻、论坛、博客、评论等舆情信息,存储到采集信息数据库中。
(2)舆情分析引擎负责对采集信息进行清洗、智能研判和加工,分析结果保存在舆情成果库中。舆情分析引擎依赖于智能分析技术和舆情知识工程。
(3)舆情服务平台把舆情成果库中经过加工处理的舆情数据发布到Web界面上并展示给用户。
(4)用户通过舆情服务平台浏览舆情信息,通过简报生成等功能完成对舆情的深度加工和日常监管工作。
第 5 页 共 12 页
网络舆情监测分析系统产品白皮书
2.3 产品意义
科学的进步及在科研领域的应用,解决了天气无法预报的难题;技术的发展及信息化工具的诞生使网络舆论提前发现成为可能;
3 产品功能
3.1 舆情规划
针对组织关注的板块不同,对采集范围及关键字进行整体规划,分类管理;能够结合当前热点话题及舆情动态,实时调整舆情采集点;
3.2 舆情信息采集
信息采集是舆情工作的首要任务,互联网传播特点和网民行为特征要求系统全面获取网络信息,信息时效性要求系统及时采集到网络信息。
系统内置数千个影响程度大、传播面广、网民参与度高的网站,从广度和深
度全面抓取信息;
1) 各大门户网站:由资讯性质网站和网络媒体构成,如新浪网、雅虎网、网
易、搜狐网……
2) 各大行业网站:由行业性质网站构成,如行业资讯网站、政府门户网站、
第 6 页 共 12 页
网络舆情监测分析系统产品白皮书
行业企业网站……
3) 交互性质网站:有各种形式的论坛、贴吧、BBS、留言板构成,如水木清
华BBS、天涯、新浪BBS……
4) 各大搜索引擎网站:同步百度和Google的搜索结果。 5) 各种微博:网易、天涯、腾讯、新浪、凤凰网……
6) 境外网站:星岛环球网、星岛日报、联合早报、韩国联合通讯社 …… 优先级信息采集,对不同影响力的网站配置不同优先等级,优先级高的网站
优先采集信息,从信息源影响力角度确保重要舆情及时传递; 信息采集形式全面,不同舆情源采用不同采集方式保障采集实时性;
3.3 舆情信息加工
系统按照各信息源表现出的网页形式呈现采集信息,网页上包含大量的广告、图片、链接,这些不是舆情关注的价值信息,还给系统的高效运行、检索增加负担。同时数据呈现按照各自信息源排列规则出现,需要系统分别去识别标题、来源、作者、发布时间、正文等,要求对信息预处理形成统一格式供后续的决策分析。预处理包含超链分析、编码识别、URL去重、锚文本处理、垃圾信息过滤、关键字抽取、关键信息提取、正文抽取、自动摘要;
双重过滤机制
第 7 页 共 12 页
网络舆情监测分析系统产品白皮书
第一重过滤:自动过滤出与“我”有关的舆情;
第二重过滤:自动排除与“我”有关舆情中不具有舆情价值的信息;
双重过滤系统将重要舆情过滤出来,将不具备舆情价值的信息排除掉,更有利于舆情影响和舆情价值的分析,舆情工作变得有的放矢。
自动分类
基于内容对经过双重过滤处理后的重要舆情自动分类,无需人工干预,准确率达到85%以上。先设置分类关键词,每一个关键词都设置一个相应的优先级分值。对收集到的文章内容进行分析,分别对标题和内容进行匹配,统计匹配的次数,然后根据设定好的关键字匹配模型对每个关键字进行分值计算。分值超过一定分值的都将自动处理所对应的处理,匹配分值最高的关键字就自动分类。
相似性排重
采用“文章相似性技术”根据文档内容的匹配程度确定是否重复,比利用网页标题和大小等规则判断具有更强的准确性、实用性以及运行效率。采用中文分词技术对文章关键字比较计算,得出文章相似度,相似度高于0.7以上的文章系统默认处理为“已处理”,无需再进行任何操作,相似度位于 0.5-0.7 之间的相似转载文章需要用户在页面进行再次确认,确保文章无漏处理。
热度分析
通过对文章转载量、点击数、回复数来分析热度。相关数据存入数据库,并自动检查链接是否存活。
3.4 元搜索功能
系统不仅支持准确及智能分类的关键字设置匹配,而且集成了基于百度、GOOGLE等关键字的搜索引擎,搜索更灵活。
3.5 舆情专题
通过用户自定义的舆情专题列表,系统用户可以轻松的区分和分类查阅专题舆情,可以通过“一周趋势分析”来完成该专题的趋势。用户可以依据舆情工作过程中的实际需要,定制多种专题分类,定制完成后系统会对采集到的舆情信息自动进行归类并在后期自动更新相关内容。通过舆情专题的功能轻松的把各种来源的信息,
第 8 页 共 12 页
网络舆情监测分析系统产品白皮书
根据设置的敏感关键字,自动建立关联和聚类。
3.6 舆情分析
以文字和图表等直观的形式,统计论坛相关数据自动生成相关统计报表,并可导出EXCEL表格。如每日主要论坛点击报告、每日主要论坛热帖排名、每日博文排名。可生成舆情趋势图及舆情分布图。
3.6.1 舆情分布图
舆情分布图展示了舆情在各大论坛中的分布,为管理员后续的思路提供了决策依据,对于舆情分布多的论坛,管理员需要重点关注。
3.6.2 舆情趋势图
舆情趋势图用来预测舆情的未来走势,可及时发现并制止重要舆情的快速蔓延。
3.7 舆情报告
根据近期对舆情关注的程度并结合监测平台统计的相关数据,半自动化快速生成舆情分析报告,供相关领导及相关部门提供决策依据。热点推荐,敏感度高,关注度高,需要大家关注的贴文,可以推荐到首页,实现信息共享。
3.8 分级权限管理
结合实际组织架构与舆情监测任务,灵活定制及维护舆情监测组织架构,方便实现层次分明的用户管理,支持建立多级组织架构,考虑到大型组织架构维护的复杂度,支持批量导入、导出功能。
3.9 用户管理
系统按照组织架构将管理员分为“省级管理员”、“市级管理员”、“分局管理员”及“普通用户”四个级别。每一级管理员可定制自己及下属机构用户关注的信息(设置关键字、选择关注论坛、虚拟帐号的维护等),确保任务的总体分发及舆情的分而治之;与此同时,支持用户的批量导入、导出功能,针对组织架构庞大的机构,无需逐个输入用户,提高用户管理效率;批量导入足够多的用户后,又可查询到具体
第 9 页 共 12 页
网络舆情监测分析系统产品白皮书
的管理员或用户。
3.10 关键字管理
为了将舆情分类及定性,系统支持分别设置“事件关键字”、“领导人关键字”及“色彩关键字”;
3.10.1 事件关键字管理
不同用户关注的舆情有所不同,系统支持配置关注的关键字,根据关键字自动匹配相关帖文并智能展现给对应用户,代替手工逐条筛选的现状,不仅提高工作效率且获取的信息更全面;
3.10.2 领导人关键字管理
在地方性突发事件中,通过网络的转载及个别心怀叵测人员的推波助澜,其地方最高领导人往往无辜的推上舆论的“制高点”,为保护领导及地方政府的声誉,将地方相关领导设置为舆情监测对象,在某些居心叵测的人员策划事件升级前,及早发现并预警舆情,才能将这些非正当事件扼杀在萌芽状态;
3.10.3 色彩关键字管理
在舆情发生后,需要对舆情进行定性。对于正面的舆情可通过回帖、转载的方式进行正向宣传,对于中性舆情要加以正面引导,以防心怀叵测之人乘虚而入、歪曲事实;对于定性为负面的舆情需要重点关注,如通过删帖等方式阻止事件进一步升级,对于触及法律底线的人员要依法追究其刑事责任;设置为负面关键词后,系统将智能匹配并预警包含负面关键词的帖子。
3.11 手工添加舆情
可通过手工添加舆情添加并集中关注上级机构推荐的帖子,并通过其它配套功能,实现相近关键词的帖文统一分析及全面跟踪;
3.12 舆情报警
用户可以根据自己的工作习惯和工作需要,定制报警任务。让这些舆情的报警
第 10 页 共 12 页
网络舆情监测分析系统产品白皮书
在指定的时间段能以邮件或短信的方式推送到用户的终端。
3.13 智能终端
随着新技术的发展、3G网络的建设和智能终端性能的提升,智能终端的应用成为一种潮流。智能终端程序拥有众多的优点,比如:交互能力强大,个性化定制能力强,与终端本身的功能紧密结合承载的业务更为丰富、承载的信息量也更大,对于舆情工作来说,智能终端使舆情应用和OA办公的融合成为现实,从而出现为用户提供一站式服务的可能性,而这些都不是传统的WAP浏览方式能实现的。
结合这些新技术和舆情工作的需要,推出了支持智能手机的舆情终端解决方案,它的出现使舆情的查阅速度更快、更安全,查阅方式也更灵活、更实时。目前主要有如下几个功能:
1、 查阅舆情:在智能终端可以更快速的查阅最新舆情、首页舆情、敏感舆情、
舆情简报。
2、 WAP浏览:可直接登录WAP站点、快速导航WAP信息页面。 3、 舆情检索:在智能终端上对系统中舆情进行检索。
4、 实时报警:智能终端程序可以在智能手机上以后台的方式运行,终端程序和
操作系统本身的消息机制集成,保证新的舆情信息到达和手机的信息提示同步,提升报警及时性的同时极大的提升了舆情报警的主动性。 ...
5、 更多新功能:更多新功能正在开发中,比如舆情交办、舆情电子指纹签批、
电子指纹认证、云舆情智能推送等。
4 系统特点
1、 采集目标全面:不仅内置100个左右国内大型主要网站采集目标,而且全面
和百度、GOOGLE、SOSO、youdao、奇虎、sogou等六种主要的搜索引擎结合,重要信息一网打尽,保证信息全面性。
2、 报警方式快捷:系统不仅支持首页报警、敏感信息预警,而且支持多手机短
信通知、多邮件报警方式。敏感报警瞬间到达,保证信息的及时性。 3、 信息查阅方便:支持WAP1.0标准以上手机客户端浏览,随时随地都可以上
第 11 页 共 12 页
网络舆情监测分析系统产品白皮书
网查阅,兼容性好且保证信息查阅的方便性。
4、 舆情简报方便:支持舆情简报HTML、自定义简报格式,支持简报生成word
格式,方便日常舆情简报的编辑、打印上报。
5、 系统管理(高安全性):USB-KEY认证方式保证只有持有管理KEY的人员才能
登录系统进行管理,这样防止因为用户名密码的泄露而造成管理上的漏洞。 6、 功能管理(高开放性):整个系统基于开放式的模块管理方式,用户可以完
全自定义系统主模块位置、名称,可以自行开发新的应用并通过“模块管理”功能无缝集成。
7、 展示管理(高灵活性):用户也可以按照自己的工作习惯任意调试子模块的
位置和名称,舆情展示界面可以自由拖拽。用户可以方便的构建一个个性化的舆情系统。
8、 舆情信息自动采集:支持定时计划采集,支持1小时粒度自动采集,保证非
工作时间内信息的收集正常运行,定义方式灵活、策略丰富、智能化程度高。 9、 敏感内容自动分析:能对定义目标的链接标题及文章内容进行自动分析,涉
及敏感信息会自动分类,同时进行敏感信息报警。
10、舆情专题自动聚类:支持对热门、敏感的舆情进行自动聚类,可自定义舆情专题,并对舆情专题进行一周趋势分析,对关注舆情的热度进行跟踪。 11、支持3G智能手机:充分结合现在的3G网络,画方科技推出了支持目前3G应用的智能手机客户端的系统,保证工作人员的移动性。同时客户端和智能手机底层消息系统集成,有消息的启用手机消息通知,非常方便实用。
第 12 页 共 12 页
因篇幅问题不能全部显示,请点此查看更多更全内容