
大数据行业发展现状及趋势预测
大数据媒体KDnuggets就大数据领域的发展现状与趋势采访了8位业内专家,以下是他们的观点。
大数领域专家、科技创业导师,作者
由于亚马逊AWS、Rackspace、Azure等云数据服务的兴起,2016年数据量出现了大规模增长,数据量增长的趋势将在2017年持续。2017年还将出现更多机器学习、认知计算、预测分析相关的项目。2017年依然会面临数据隐私问题,数据科学家、首席数据官、首席架构师等职位在2017年会越来越热门、定位也会越来越清晰。实时数据流和更加复杂的数据管道将重新定义大数据。
IBM数据科学布道师
Hadoop在大数据领域衰落的速度比我预想的更快,MapReduce、HBase,甚至HDFS对于数据科学家也没有以前那么重要了。
2017年最主要的趋势是更多的程序员学习选择数据科学技能,以发展自己的职业生涯。2017年最热门的数据科学项目会聚焦在流媒体分析、嵌入式深度学习、认知物联网(cognitive IoT)、认知聊天机器人、嵌入式机器认知、自动驾驶汽车、计算机视觉和语音识别等领域。同时,我们也会在明年看到新一代的神经网络芯片、GPU和其他的高性能认知计算框架。
Gartner副总裁,知名分析师
2016年大数据最大的一个变化是人们不再谈论大数据了,大数据的概念已经普及。关注的重点逐步转为商业导向,如何管理、评估“信息资产”,以及如何对“信息资产”进行变现。
2017年我们应该努力弄清楚数据权利和责任、所有权,尤其是涉及到物联网数据。目前数据资产在会计业、律师界和保险行业都十分棱模两可。但随着机构投资人和分析师越来越看重企业的信息化程度,这种情况会逐步改善。2017年大公司会越来越注重大数据人才,比如数据经理人和其他信息整合人才。
2016年大数据已经没有前几年那么火热,随着大数据基础设施、软件和理论的发展,大数据分析解决方案已经越来越成熟、普及,不再仅仅局限于少数先行者。随着大数据的成熟,自助服务和自动化得到越来越多的关注。虽然大数据分析解决方案越来越容易获取,但是我们仍然需要具备通信、信息处理技术的专业人员才能使用。随着人工智能、机器学习、VR、AR、物联网、容器技术的发展,大数据解决方案将进入新的阶段,越来越逼近摩尔定律的边界。
Datafloq创始人,《ThinkBigger》作者
对于大数据,2016年是令人激动的一年,大数据不再只是一个热门概念或者流行词语。因为大数据公司已经开发了实际的解决方案和应用。
在2017年这种趋势将会持续,随着技术越来越智能,我们会看到新的应用被开发出来。深度学习和人工智能将变得更加智能,并将更多地应用于组织机构,因为计算能力和数据量不再成为开发智能应用程序的障碍,2017年将是令人兴奋的一年,但随着大数据、智能应用的发展,数据安全问题也越来越严重。
大数据科学家、Adversitement主管
2016年,大数据经历从单一部门到跨部门的应用。物联网数据应用开始在一些关键领域出现,此外,随着云计算平台的发展,为越来越多的机器学习应用研发提供了支持。
2017,我们会看到人工智能的增长、物联网应用的爆发,以及机器学习的广泛应用。技术已经准备好了,而且用户对大数据技术改善体验的需求非常强。根据预测,2020年连网设备数将达到100亿到340亿之间。
斯坦福大学教授、计算学科学家
欧盟已经根据数据的使用和分析模型出台了一个新的隐私保护法。将在2018年1月开始生效。这一法案将会造成怎样的影响现在还不可知,但数据公司一直十分纠结到底哪些数据和分析方法是允许被使用的,比如Google可以分析用户邮件内容,以判定是否为垃圾邮件,但Google到底有没有读取用户邮件内容的权力?
Databricks首席科学家、Apache Spark创始人
公有云正在成为部署大数据的主流方式。根据Apache Spark今年夏天的用户调查,在公有云部署Spark的用户比例达(61%)比使用Hadoop YARN的用户(36%)更高。此外,使用公有云的用户从2015年的51%增长到61%,使用HadoopYARN的用户从2015年的40%下跌到36%。其中的一个原因是亚马逊S3这类云存储产品价格越来越低,越来越稳定,也比Hadoop分布式文件系统更容易管理。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03