京公网安备 11010802034615号
经营许可证编号:京B2-20210330
从IT到DT:阿里大数据背后的商业秘密
空气污染究竟在多大程度上影响了人们的网购行为?有多少比重的线上消费属于新增消费?为什么中国的“电商百佳县”中浙江有41个而广东只有4个?
这些电商的秘密就隐藏在阿里巴巴商业生态的“大数据”中。
“未来制造业的最大能源不是石油,而是数据。”阿里巴巴董事局主席马云如此形容“数据”的重要意义。
在他看来,阿里巴巴本质上是一家数据公司,做淘宝的目的是为了获得零售的数据和制造业的数据;做蚂蚁金服的目的是建立信用体系;做物流不是为了送包裹,而是这些数据合在一起,“电脑会比你更了解你”。与此同时,产业的发展也正在从IT时代走向以大数据技术为代表的DT时代。
而在阿里巴巴内部,由电子商务、互联网金融、电商物流、云计算与大数据等构成的阿里巴巴互联网商业生态圈,也正是阿里研究院所扎根的“土壤”。
具体而言,阿里巴巴平台的所有海量数据来自于数百万充满活力的小微企业、个人创业者以及数亿消费者,阿里研究院通过对他们的商务活动和消费行为等进行研究分析,从某种程度上可以反映出一个地方乃至宏观经济的结构和发展趋势。
而随着阿里巴巴生态体系的不断拓展和延伸,阿里巴巴的数据资源一定程度上将能够有效补充传统经济指标在衡量经济冷暖方面存在的滞后性,帮助政府更全面、及时、准确地掌握微观经济的运行情况。
从IT到DT
不同于一些企业以技术研究为导向的研究院,阿里研究院副院长宋斐告诉《第一财经日报》记者,阿里研究院定位于面向研究者和智库机构,主要的研究方向包括未来研究(如信息经济)、微观层面上的模式创新研究(如C2B模式、云端制组织模式)、中观层面上的产业互联网化研究(如电商物流、互联网金融、农村电商等)、宏观层面上新经济与传统经济的互动研究(如互联网与就业、消费、进出口等)、互联网治理研究(如网规、电商立法)等。
具体到数据领域,就是在阿里巴巴互联网商业生态基础上,从企业数据、就业数据、消费数据、商品数据和区域数据等入手,通过大数据挖掘和建模,开发若干数据产品与服务。
例如,将互联网数据与宏观经济统计标准对接的互联网经济数据统计标准,包括了中国城市分级标准;网络消费结构分类标准;网上商品与服务分类标准等。
而按经济主题划分的经济信息统计数据库则包括商品信息统计数据库;网购用户消费信息统计数据库;小企业与就业统计数据库;区域经济统计数据库。
还有反映电商经济发展的“晴雨表”——阿里巴巴互联网经济系列指数。其中包括反映网民消费意愿的阿里巴巴消费者信心指数aCCI、反映网购商品价格走势的阿里巴巴全网网购价格指数aSPI和固定篮子的网购核心价格指数aSPI-core、反映网店经营状态的阿里巴巴小企业活跃度指数aBAI、反映区域电子商务发展水平的阿里巴巴电子商务发展指数aEDI等等。其中,现有aSPI按月呈报给国家统计局。
而面向地方政府决策与分析部门的数据产品“阿里经济云图”,则将分阶段地推出地方经济总览、全景分析、监测预警以及知识服务等功能。宋斐告诉记者,其数据可覆盖全国各省、市、区县各级行政单位,地方政府用户经过授权后,可以通过阿里经济云图看到当地在阿里巴巴平台上产生的电子商务交易规模、结构特征及发展趋势。
“借助数据可视化和多维分析功能,用户可以对当地优势产业进行挖掘、对消费趋势与结构变动进行监测、与周边地区进行对比等等。”宋斐表示,该产品未来还可以提供API服务模式,以整合更多的宏观经济数据和社会公开数据,为当地经济全貌进行画像,给大数据时代的政府决策体系带来新的视角和工具。
数据会“说话”
对于如何利用“大数据”,马云在公司内部演讲中曾提到:“未来几年内,要把一切业务数据化,一切数据业务化。”
其中,后半句话可以理解为,让阿里巴巴各项业务所产生、积累的大数据来丰富阿里的生态,同时让生态蕴含的数据产生新的价值,再反哺生态,这是一个相辅相成的循环逻辑。
宋斐对记者举例称,蚂蚁金服旗下的芝麻信用已获得人民银行个人征信牌照批准筹备,未来将通过分析大量的网络交易及行为数据,如用户信用历史、行为偏好、履约能力、身份特质、人脉等信息,对用户进行信用评估,这些信用评估可以帮助互联网金融企业对用户的还款意愿及还款能力做出结论,继而为用户提供快速授信及现金分期服务。本质上来说,“芝麻信用”是一套征信系统,该系统收集来自政府、金融系统的数据,还会充分分析用户在淘宝、支付宝等平台的行为记录。
再如,对于如火如荼的农村电商领域,阿里研究院从2010年就已开始对“沙集模式”个案进行研究,后续一系列基于数据和案例调研所驱动的农村电商研究成果,对于地方政府科学决策,推动当地农村电子商务发展、创造就业和发展地方经济起到了助力作用。到2014年底,全国已经涌现了212个淘宝村,而阿里巴巴也在这一年启动千县万村计划,将在三至五年内投资100亿元,在农村建立起电子商务服务体系。
除了通过数据分析去助力业务外,宋斐告诉记者,有时候大数据报告可能会与传统的印象结论差异很大。
以区域电子商务为例,在阿里研究院发布的2014年中国电商百强县排行榜中,浙江有41个县入围,福建有16个,而广东只有4个,这个结果与传统的印象相差比较大。而事实上,这是因为浙江和广东两省电商发展在地理分布、产业结构等方面的明显不同而带来的。
再如,外界常常认为网络零售替代了线下零售,但事实上,麦肯锡《中国网络零售革命:线上购物助推经济增长》的研究报告,通过借鉴阿里研究中心(阿里研究院前身)和淘宝网UED用户研究团队的大量报告与数据,最后发现:“约60%的线上消费确实取代了线下零售;但剩余的40%则是如果没有网络零售就不会产生的新增消费。”
“这一研究成果,有助于社会各界准确认识网络零售与线下零售的关系,共同探索和建设良好的商业发展环境。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11