京公网安备 11010802034615号
经营许可证编号:京B2-20210330
预测2016年:大数据行业的变与不变
“这两年大数据的风头明显盖过了云计算,这不是好事。”近日,华为IT产品线大数据解决方案规划总监徐兴海在2015中国大数据技术大会上如是说。他认为,云计算已过了炒作期,在公有云的带动下实现了规模化落地,“已经开始赚钱了”;而在去年,大数据的发展还在泡沫的破灭中,今年大数据已开始有走入应用的“苗头”,“而不仅仅是炒作”。
除了从“炒作”到走向“泡沫的幻灭”,备受瞩目的大数据在2015年还经历了哪些变化?又将如何迈入2016年?几个月后,由中国计算机协会大数据专家委员会编撰的第三版关于大数据的白皮书将发布,大数据专家委员会副秘书长潘柱延却“提前泄密”,他分析了大数据行业的几个关键词:民生、多样性和融合性、政策拉动、大数据生态。
十大趋势不容忽视
据潘柱延介绍,今年大数据专家委列出了2016年大数据产业技术发展的十大趋势,而这些趋势可以解释上面提到的关键词。
“可视化技术推动大数据平民化被专家选为了第一大趋势,这是非常有意思的结论,工作组也感到很意外。”潘柱延解释,可视化作为技术形态能排到第一,其实背后隐藏着大数据的平民化,普通老百姓和常规的决策者能够更好地理解大数据的效果和价值。
大数据将引导多学科融合。不仅是计算机领域的科学家,数学等其他领域的科学家也将参与到大数据的前沿研究中。
大数据的安全和隐私也受到了持续关注。对大数据的威胁和对大数据所产生的副作用,以及大数据发展中的障碍会逐渐成为大数据领域的关注点。潘柱延指出,虽然现在并没有针对大数据攻击的大规模报道,但是安全和隐私方面的隐忧已令大家担忧,这也是阻碍大数据发展的问题之一。
还有许多新热点将持续融入大数据的模式中,形成更加平衡的路径。而且,大数据将在民生领域重点应用,提升社会治理的效果。“和民生相关的,如智慧城市、应急、反恐等都会是发展重点,专家组认为这样的领域可能实现爆发性的发展。”潘柱延说。
9月5日,国务院印发了《促进大数据发展行动纲要》,并指出:将在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系。
大数据专家组认为,该纲要将对大数据的发展起到推动性的作用,成为大数据产业快速发展的催化剂和政策标杆,也将推动地方政府出台类似的配套政策。潘柱延指出:“除了学术、技术、商业的推动外,政策的扶持会产生很大作用,大数据相关的基础设施建设和大数据创业公司在双创政策的推动下,两个驱动力会快速带动大数据的发展。”
在学术技术研究上,深度分析会继续成为推动大数据智能应用的代表之一。美剧《疑犯追踪》中曾展示了大数据的最终极应用——人工智能体几乎主宰人类生死的场景。在该大数据会议上,IBM的专家也展示了2011年曾挑战人类智力竞赛并获得冠军的超级电脑系统Watson。潘柱延认为,在人工智能领域,涉及与人的相关能力延伸,比如,决策、预测、精准推介等都将继续是大数据技术和学术研究的重要应用关注点。
数据权属与数据主权将得到进一步关注,所有权属和主权的利益冲突和争夺都是来自数据资源化、数据价值化。不仅如此,大数据的应用领域还将从“老三样”迈进到“新三样”,即从互联网、金融、健康这三个增长点转换成城市、企业和工业数据这三大新增长点。
谈到人才和技术的生态方向,大数据专家组预测,开源将持续成为大数据发展的主导性的技术方向和技术平台,测评则会以良币驱逐劣币的方式引导优秀的大数据技术发展,而各种各样的创业创新大赛也会成为人才和技术生态完善的一个重要标准和驱动力。
大数据之变
根据2013年发布的大数据白皮书显示,十大关注点在于:数据的资源化,大数据的隐私问题突出,大数据与云计算等深度融合,基于大数据智能的出现,大数据分析的革命性方法,大数据安全,数据科学兴起,数据共享联盟,大数据新职业和更大的数据。
而2014年的十大关注点是:大数据从概念走向现实,大数据架构的多样化模式并存,大数据的安全和隐私,大数据的分析与可视化,大数据产业成为战略性产业,数据商品化与数据共享联盟化,基于大数据的推荐与预测流行,深度学习与大数据智能成为支撑,数据科学的兴起与大数据生态环境逐步完善。
基于此,潘柱延分析,从2013年到2014年,大数据从概念走向了价值。而从2014年到2015年,大数据出现了几个明显的变化点,如跨接融合、基础互换和基础突破等亟待解决的问题,从2015年到2016年,大数据最重要的变化则是民生、多样、政策和生态。
4年来,大数据受到关注的应用领域包括互联网、电子商务、金融和健康医疗等,最新的关注领域则是城市化、智慧城市、舆情分析、社会安全等。
据大数据专家组预测,2016年与城市、互联网交易和企业相关的三部分数据可能会取得突破性进展,未来一年的资本投入将对该趋势有所印证。
潘柱延透露,今年的大数据白皮书中重点讨论的是大数据开放共享。
在调研中,大数据专家组邀请了100多位专家讲述2016年的大数据计划以及对数据流转的态度。调研结果显示,业内专家都希望能自己收集数据,并利用收集的数据进行数据服务,希望能买到“数据机”,而专家和其所在的机构计划卖“数据机”的却非常少。
潘柱延指出,数据流转整体处在需求大于供给的状态,尤其是数据国际交换和卖数据。“希望通过政府开放共享,拉动数据交流和交换。政策性是大数据发展的重要指标,不可否认,大数据本身具有概念性,有泡沫存在,但是不能因为啤酒上有泡沫而放弃底下香浓的啤酒。”他强调。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23