
大数据时代网络舆情工作挑战与机遇并存
近日,由北京市网信办、首都互联网协会组织的“大数据时代网络舆情工作座谈会暨数据分析专业委员会第一次工作会议”在京召开,来自清华大学、中国传媒大学、 中国人民大学、人民网、新华网、清博大数据等10余位学界专家以及业内专业人士就“大数据如何更好地服务舆情、服务决策、服务社会治理”主题进行了研讨。
清华大学教授沈阳认为目 前舆论场存在三个基本判断与两个新变化。三个基本判断:自媒体的公司化,获得了风投的自媒体发展成了媒体公司,对中国舆论场具有重大影响;各大互联网公司 的自媒体战略对舆论场影响越来越明显;互联网在经济领域的影响持续增强,知识阶层话语权也日益增强。两个新变化:信息传播的场景越来越重要和青春媒体对青 少年群体影响加大。
中国传媒大学教授沈浩谈到依靠网络分析技术、对自然语言处理的技术、追溯空间地理的技术、可视化技术四项技术支撑应对舆情。
中国人民大学副教授周俊阐 述了网络舆情脆弱性评价体系的作用:舆情脆弱性(累积型)是指政府(包括应对机构、当事部门)对舆情扰动的敏感性以及缺乏适应性而遭受损害的可能性,这是 基于政府本身的基础、实力、准备、建设的内部属性。完整的舆情脆弱性评价体系能够揭示区域政府、不同政府部门、不同行业的内在深层次问题或突发舆情的内在 因素的变化,从而有的放矢地把握舆情预警和应对的关键因素的重要手段。
人民网首席数据师潘宇峰认为应搭建舆情案例库进行科学预警。建立案例库,通过特征向量去判断新发生的事件,如果有一些重合的就判断出可能是属于某一类特定事件。根据波峰进行简单的预测,比如事件类型、发生源、传播热度的变化情况等。
新华网舆情监测分析中心总监段赛民倾向于借助舆情指数进行舆情预判,对每天舆情场上一些舆论热点问题进行研究和指导。“我们做了一个示范项目,最大的功能是推演和预测。通过大数据做到舆情事件的预判和舆情事件走势的分析,对城市管理具有重要意义。”
清博大数据科技有限公司副总裁傅文仁认为舆情处置有五大关键词:基本判断、处置原则、处置方法、注意事项、效果预测。
艾利艾智库互联网信息事业中心研究总监崔斌认为更应重视前沿阵地与新型网络表达方式。现在微博、微信上爆出的信息,本质上已属于二次传播,在很多新兴平台上已发表过一轮。此时去应对,在时间上有一定的滞后性。随着90后的网络原住民逐渐成长起来,网民参与群体的构成发生了很大变化。一个最突出的现象就是网络热词,表达的形式太多样化。如不追溯新词的意义,当这些词出现在舆论场中,我们却不清楚什么意思时,会影响对整个网络舆情的舆论导向的判断。因此,如何判断网民的态度,可能需要结合新的表达方式和新的表达语境,这也是大数据需要完善的方面。
湖南蚁坊软件有限公司副总经理张兵认为应建 立互联网舆情词库消除信息歧义。对于网络结构用户关系的分析,以图数据库、图计算等技术为基础,在这个结构下,进行影响力的活跃度、虚拟社区的发散和演化 分析。对这些信息分析时,如何消除歧异,就需要建立整个互联网的舆情词库,包括有网民正话反说,指桑骂槐,这对判断舆情的正负面有重要参考价值。趋势预测 方面,需要基于用户、信息、时间、空间等多维图谱,进行概率性推断或发现。
央视国际网络无锡有限公司舆情中心总监张寅鸿认为网络舆情评价指标体系包含几个维度:互联网传播能力,尤其是自媒体场和媒体场要区分开;政府应对能力,尤其是政府对事件的处理和危机公关能力;社会影响力,就事件本身来说,不同的领域反应不同,需要区分考量。
友盟+高级技术专家罗文川认为可通过数据整合进行用户描述。通过整合用户浏览数据,可以更全面地了解一个事件的发展脉络,并且PC端的数据和移动端的数据不互相影响。而把移动端数据和PC端数据结合起来,可以更好地描绘用户发展路径,用户关注的内容,更好地分析用户关注的程度。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10