京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2017:大数据支撑“AI+”加速落地
过去的2016年,政府、行业以及大众对大数据的认知有了更进一步提升,但是大数据的应用落地及价值体现还是处在初级阶段,大数据如何促进创新创业,带来新的经济增量,如何推动传统行业转型升级,如何实现商业价值在2017年将会受到更多关注,尤其是以大数据为基石的人工智能应用将会驱动着“AI+”的发展。
2016:数据新能源价值拓展从互联网到传统行业
阿里巴巴集团董事局主席马云在10月份云栖大会上首次提到“五新”的趋势,分别是新零售、新金融、新制造、新技术和新能源。而数据正是代表的新能源,过去的发展是基于石油和煤,未来的发展是基于新的能源,那就是数据,数据是人类第一次自己创造了能源,而且数据越用越值钱。
数据作为物理世界在虚拟空间的客观映射,人、事、物都在被数据化,人与人、物与物、人与物之间瞬间就会产生大量的数据,数据成为新经济的生产要素,如同工业时代的钢铁、石油。数据新能源只有在使用中才能不断体现和衍生出价值,2016年我们看到大数据实践从互联网行业拓展到越来越多的传统行业、政府部门的实践。
1、政府部门着力推动大数据相关政策法规、机构及产业发展
自2015年9月国务院发布《关于促进大数据发展的行动纲要》,十八届五中全会公报提出要实施“国家大数据战略”之后,大数据相关地方和行业政策法规依次出台。2016年1月15日,贵州省通过了《贵州省大数据发展应用促进条例》,这是中国首部大数据地方法规,将大数据产业纳入法治轨道,以立法引领和推动大数据产业蓬勃发展。
截止2016年底,全国已有30多个地方政府部门出台了大数据相关的政策文件,10多个地方政府专门设置了大数据管理部门,统筹推进大数据发展。目前全国已建或拟建的大数据产业园区超过10个。这些大数据产业主要分布在北京、上海等比较发达的地区,并已形成了较完备的产业链,产业规模也在不断扩大,为相关企业向大数据产业迅速转型奠定了良好基础。
政府行业的信息化和数据化水平参差不齐,但作为国家大数据行动纲要的重要目标之一——政府和公共数据资源的开放共享是目前重要方向,将会大幅提升政府治理创新能力和决策水平,也有助于利用社会力量实现协同治理的目标。根据初步统计,截止2016年8月,我国共有19个地方政府部门建有数据开放平台网站。但数据开放水平和政府数据价值挖掘还有待提升,不少政府部门认识到数据即权力,对于数据共享开放持保守的态度。
另一方面,信息化水平比较高的政府部门已经着手搭建统一的大数据平台,比如海关、国税总局等在探索依赖云计算技术建立统一的大数据平台,提升部门内部数据的共享,打通信息孤岛,提升政府治理能力和水平。交通部门与互联网企业紧密合作,推动交通大数据的融合助力城市交通治理能力的加强。
2、大数据的落地与行业的互联网化和信息化水平紧密相关
2016年,大数据加速在行业应用场景的落地,从互联网行业向传统行业的渗透进程加速。但总体来看,应用水平最高的是互联网行业,在线实时的数据成为支撑互联网行业业务的基石,围绕着消费者进行个性化推荐和精准营销成为最主要的应用场景:
比如,在2016年双11期间阿里平台上的千人千面服务使得每个消费者都可以拥有自己专属的双11就是典型的智能个性化推荐的应用场景,同时基于大数据的风险控制、贷款服务和信用应用也成为数据外部化应用的典型场景;
比如蚂蚁金融的小微贷款和芝麻信用服务,依据阿里巴巴商家在平台上的数据建立的信用风险模型让商家可以获得310的贷款服务(3分钟申请,1秒钟审批,0人工干预),个人的芝麻信用分数可以应用在大量的商业消费场景中;
比如租车、酒店住宿、婚恋、签证服务等,同时也在帮助最高人民法院对“老赖”进行信用惩戒方面提供了新路径。
金融和电信行业作为信息化水平较高的行业,不仅有大量的历史数据积累,同时也越来越重视内外部数据的整合应用,从支撑业务、支撑决策,到营销类应用和风险控制类应用,数据的价值在逐渐扩大,我们还看到电信运营商的信令数据可以为交通治理服务这样的外部应用开始逐渐浮现和发展。
传统制造业、物流、医疗、农业等行业在很多点的大数据应用方面也有突破,比如“大数据+工匠精神”对于制造业的转型升级至关重要。而大数据的实时、感知和预测等特点确实可以为制造企业在降低成本,缩短生产周期,提升效率,细分产品定位,优化流程和决策等方面扮演重要的角色
阿里巴巴目前也已经和徐工集团开始进行合作,希望利用阿里云上面的大数据能力,协助徐工建中国工业大数据平台,实现“阿里云+徐工”=“中国的Predix”,在工业大数据平台、应用及生态建设方面探索一条新路。
索菲亚在探索C2B的实践过程中,数据对于其规模化和个性化的平衡起到关键作用。索菲亚认为自己不是家具制造企业,而是一家大数据企业。在调研时我们发现,索菲亚有强大的科技团队,超过400多人,而其中300多人是在做数据加工。索菲亚利用大数据提升客户体验,提高交付效率,减少差错和库存,基本可以做到零库存水平。在索菲亚的前端需求到后端的生产系统中,数据的共享、联通和流动是实现订单准确地从需求端传递到生产制造和采购端的关键。
3、数据商业化面临诸多挑战
虽然在2015到2016年,不少地方政府主导成立了数据交易所,一些商业化的数据交易平台也上线运营,但目前基于数据的全新商业模式依然还处在探索的初级阶段,数据交易、交换及服务的商业化面临诸多挑战,比如应用场景和价值不易标准化,数据定价及资产评估问题,安全和隐私的问题,政府数据开放的速度较慢问题等。
作为新能源,数据是越用越有价值,但也正是如此,同样的数据在某个场景下价值很大,在其他场景下可能没有价值,数据的应用场景和价值不容易标准化,就如同挖金子的初期一样,真正赚钱的还是卖铁锹的,如今还没有到真正卖金子的时候。
数据与工业时代的商品有截然不同的属性,工业时代的商品是实体物品为主,基于一定成本的原料生产后,基于工厂相对标准化的大规模生产模式生产出来;而目前的数据应用水平和程度有限,数据标准化程度很低,无法按照传统的商品销售模式进行销售。
工业时代的商品经历了上百年的发展之后,已经形成了大家都认同的标准化定价模式,比如基于物权的定价模式,基本上是成本加上品牌定价;而数据的权属问题目前还是个大难题,传统物权、知识产权等都存在不适用的部分,同时数据产生的边界成本基本为零,因此目前从数据加工的成本和基于数据加工衍生出的服务出发,以API或数据集的方式销售给用户是一些在尝试的模式,比如以数据堂、聚合数据为代表的第三方数据服务公司正在采用这样的模式,还有以DaaS(DataasServices)的云服务模式提供给用户使用,但总体规模和盈利模式都远不成熟。
2017:大数据支撑AI+加速落地
2016年的AlphaGo和年底的Master通过人机大战让人工智能成了尽人皆知的概念,但外在的人机大战背后是内在的数据+计算+算法能力的崛起,正是这三个因素让诞生了60年之久的AI在今天再度成为热点。笔者曾经听一位从事机器学习领域研发的资深专家讲,猛然在2016年才意识到自己原来从事的是AI行业,以前从来没有意识到。可见AI的热度并非凭空产生,是多年的技术发展到一定阶段的结果。
2017年,大数据的发展有以下几个主要趋势:
1、数据+算法+计算能力加速AI+落地
云计算技术的日臻成熟和成本的降低奠定了大数据发展的技术基础,深度学习算法的兴起和发展使得计算+数据+算法三者支撑的人工智能走下神坛。
伴随着大数据时代的到来,多来源、实时、大量、多类型的数据可以从不同的角度对现实进行更为逼近真实的描述,而利用深度学习算法可以挖掘数据之间的多层次关联关系,为人工智能应用奠定了数据源基础。目前的人工智能应用场景都是以大数据作为基础的,比如在搜索、推荐、语音交互等场景中已经有了不少成功实践。
2、基于数据融合和外在价值的探索会诞生新商业模式
目前大数据比较成熟的场景是包括个性化推荐和营销类应用,以及风险控制、信用评估类应用。我们看到,大数据产品技术及解决方案的创新比较清晰,开源技术基础上的创新和服务是主要方向,但围绕着数据本身的新商业模式还在探索过程中。
2017年,基于数据融合和外在价值的创新模式会诞生新的商业模式,企业内外数据、线上线下数据融合产生化学反应,基于数据的创新模式给我们无限想象空间。
3、大数据开始重构传统工业和制造业的价值链
传统企业和行业用户已经开始围绕着数据进行业务流程重构和再造,以数据为核心开始尝试业务创新模式,比如C2B/C2M模式实质是以消费者数据为核心倒逼传统产业的升级转型。2017年传统工业和制造业会更多地关注数据如何驱动主要传统产业的解构、重构和再造,基于数据的传统产业转型升级成为主流。
4、围绕着数据权属、个人信息保护、跨境数据流动的相关政策法规标准出台
2016年《网络安全法》的出台引起了社会上对数据安全相关领域的强烈关注,2017年数据权属、个人信息保护以及跨境数据流动相关政策法规标准会逐渐完善,推动《网络安全法》的落地实施,促进我国大数据的健康有序发展。
正如前面所讲,数据权属的界定目前也需要有相应的法律规范出台他,它对于基于数据的创新创业影响巨大。过往几年中基于数据买卖的地下灰黑产业非常猖獗,带动了消费者个人和国家对个人信息保护的关注,但目前来看我国个人信息保护相关的法律规范尚不完善,目前只在一些法律中有零散规定,仍然存在效力层级低、法律法规协调性弱、保护内容片面等立法不足,有待于加强和完善。
同时,互联网使得数据的跨境流动变得普遍,我国越来越多的企业在通过互联网成为全球化企业,数据本地化和跨境数据流动的问题会日益凸显。大数据产业发展呼唤政策法规标准的快速跟进。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11