京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据价值体现在AI、BI、CI和DI
都说大数据是新石油,亚马逊前首席科学家教你怎么开发它。怎样才能让你的企业像亚马逊、谷歌那样拥有“大数据DNA”?
无人机送货、阿法狗下棋、小冰和你谈场恋爱……人工智能领域的成果,一直是企业在大数据运用能力上的主要外在体现,但在亚马逊原首席科学家安德雷斯韦思岸(Andreas Weigend)看来,大数据能为企业做的,还远不止如此。
以韦思岸之见,大数据对于企业的价值,更全面地来说可以体现在AI、BI、CI和DI,即人工智能(Artificial Intelligence)、商业智能(Business Intelligence)、客户智能(Customer Intelligence)和数据智能(Digital Intelligence)这四个方面。
AI:人工智能
当前,极力开发人工智能的适用领域,成为了企业界的热门话题,甚至连企业CEO等职位可否被替代,都频频被纳入讨论之中。韦思岸对此的观点则是:“机器应该只负责完成比人类更擅长的任务”。
人工智能的概念其实早已被提出,而上世纪70年代、90年代的两次“人工智能寒冬”之所以会出现,是因为彼时大数据发展尚不成熟,人工智能难以完成规模化的深度学习。等到近年来大数据行业取得突破性进展,人工智能领域才不断迎来突破。
所以,人工智能的主要优势,在于记忆与运算大数据,并从大数据中发掘深层次信息。
《大数据和我们》中有一部分内容就阐述了博世公司的典型案例。
通过车载摄像头,博世的自动泊车系统可以记录并测量停车位的位置分布、空间大小、距离远近等大数据,并把它们上传至卫星定位系统,通过把海量大数据带入建模得出完成停车的行驶线路。而博世最近公布的、预计于2018年面市的Home Zone Park Assist服务,更是可以为汽车预存最多10条泊车路线,让人工智能在大数据的助力下为用户实现自动泊车。
也正因如此,能获取可观数据量的公司,往往更可能在这一领域取得成果。韦思岸认为,包括阿里巴巴、腾讯等在内的一些中国公司的优势,正在于此。
尤其是在近几年,每年有超过6.5亿人登录阿里巴巴旗下网站购物,而微信的用户也突破了8亿,这使得阿里巴巴、腾讯跻身全球拥有最多大数据的几家公司之列,他们也完成了在相应领域的突破。例如,阿里巴巴就在2016年8月的云栖大会上,推出了其首款人工智能机器人ET,而腾讯也于2016年12月26日宣布,将向全球企业提供包括图片标签、名片OCR识别等在内的7项AI云服务。
BI:商业智能
与计算机的优势在于记忆、运算相对应,人的优势则在于创新能力与决策能力。
所以,“数据驱动”这个近年来开始流行的管理理念,在韦思岸看来是有失偏颇的,而“驱动数据”,才应该是让大数据应用到企业决策、管理等领域的理性路径。两者的区别是,前者是以 大数据统御人类的决策与判断,而后者是让大数据处于人的掌控之中。事实上,大数据本身是非常粗略的,数据样本有可能非结构化,甚至可能掺杂了欺诈数据。
把大数据置于其擅长范围以内,用大数据来构建辅助企业决策的预知系统(anticipatory system),才是其助力企业提升商业智能的更合理选择。韦思岸也以具备“大数据DNA”这一比喻来形容这类企业。
韦思岸加入亚马逊也与此有关。韦思岸说,亚马逊创始人杰夫 贝佐斯(Jeff Bezos)早年就意识到大数据对于企业的重要性,因此邀请自己来一起为亚马逊制定大数据战略,让公司真正拥有大数据DNA。此后,亚马逊的商品推荐系统、第三方在线销售平台等创新性服务,不仅改善了顾客的购物体验,还让亚马逊自身能更科学地制定经营与市场战略。比如通过对大数据统计的总结,亚马逊就调整了自身的市场划分,把以往几十个细分市场的分类,演变为“将单个顾客一分为十”的全新分类。
更重要的是,具备大数据DNA的企业并不会惟大数据是从,而是在决策时把它置于辅助性地位。亚马逊计算机中心时区设置的不统一,曾让一些商品从浏览到购买的时间为负值,这也让亚马逊开展了自我纠正,重新基于其全球化经营战略设置了计算机时区等内部系统架构。以韦思岸之见,亚马逊与其说是一家电商公司,不如说是一家科技公司。这也正是这家1995年才成立的公司能保持迅猛发展势头,并在2016年《财富》全球500强榜单中排名第44位的重要原因。
当然,《大数据和我们》一书也向我们展示,大数据DNA并不一定是科技公司的专利。在书中,全球规模最大基金公司桥水基金就于近期宣布,公司未来的员工招聘、绩效评定、日常管理等领域,将引入大数据辅助决策,桥水基金创始人雷伊达里奥(Ray Dalio)也表示,相信这样能“有助于提高认识、改进决策过程并实现更好的成果”。
“我们应当让人去做人擅长的事,让计算机去做计算机擅长的事”,正如韦思岸所言,人与计算机的深度协同,才是企业具备大数据DNA、能以商业智能取得领先的象征。
CI:客户智能
既然大数据是为人们决策提供辅助信息,那么,哪些信息相对不重要,哪些信息则相对更重要?“我喜欢听到用户们通过大数据来发声”,韦思岸把来源于经营第一线的用户数据,看作是更重要的大数据。
《大数据和我们》记录了韦思岸于20世纪90年代初在施乐公司的帕克研究中心工作时的情形。虽然当时已经诞生了超级计算机,但囿于数据量的缺乏,这位斯坦福大学博士仍只能通过大量假设来进行研究。
而现在,通过来源于客户的大数据,企业就能倾听到客户真实的心声,并以源自于客户方面的客户智能作为自身在行业内保持领先的基础。在韦思岸看来,其曾经提供过咨询服务的多家企业,如阿里巴巴、汉莎航空、摩根大通、GE等,都已非常注重客户数据对企业发展的意义。比如据韦思岸回忆,在与自己共同出席一次会议时,马云就曾表示“call me Data Ma”。
能真切听到客户通过大数据发出的心声,这只是第一步。客户数据能否转化为客户智能,关键还在于,企业经营决策的制定能否真正以客户需求为中心。
事实上,这也是体现企业领导者能否真正在企业内贯彻大数据DNA的一个分水岭。
例如,在当今的移动互联网时代,用户的一大诉求是希望企业能注重保护自己的数据隐私。但各类大规模用户资料泄露事件就表明,这一客户心声并非业内许多公司的真正关注点。苹果公司则是极少数的特例之一。2016年2月,蒂姆库克(Tim Cook)能拒绝FBI关于在苹果设备预留后门的要求,让苹果注重客户隐私保护的声誉进一步提升,而一部分用户是非常愿意为此支付相应价值的。
此外,如果企业目前暂无能力获取海量客户数据,那么,通过数据服务商或中间商来查阅大数据,也是企业提升自身客户智能的合理选择。
比如,包括宝马、福特、MapQuest等在内的企业已经与微软旗下的Inrix开展了合作,后者是日均可分析超过1亿部智能手机地理位置数据的公司。再比如,餐饮、院线等行业内的企业可以通过Yelp、大众点评等网站获悉各类客户数据,以改善企业的服务与产品线。
DI:数据智能
如果一家企业能够在行业变革趋势洞察,企业内部决策制定,以及企业外部客户分析上充分运用大数据,那么,这就是企业在数据智能方面的体现。对此,韦思岸用了“ABC客户行为模式”(ABC of Consumers’ Behavior)来予以概括。
A代表认可(Approval),表明企业在获取和运用大数据助力企业发展时,需尽量获得用户的肯定。
亚马逊在建立用户点击与购买量的数据库时,并不保存每位客户的身份信息,而是只关注客户从一件产品到另一件产品的跳转轨迹。韦思岸认为这是亚马逊能获得不少客户认可的重要因素。
B代表归属感(Belongingness),这说明,具备数据智能竞争力的企业,都善于提升其用户黏性。《大数据和我们》中就列举了南非保险商探索健康公司的例子。探索健康公司与超市、商店共同推出的“活力”促销计划,为客户提供金钱奖励。若客户的支付记录显示他们购买了健康食物,他们就能凭此获得返现或保费折扣。
C则代表多重含义,比如对话(conversation),比如交流(Communication),又比如社区(Community)。
韦思岸也对界面新闻记者表示,他在与好友、2002年诺贝尔经济学奖得主丹尼尔 卡内曼(Daniel Kahneman)探讨后,两人都认为C最重要的含义是连接(Connection)。在行将来临的由人工智能、云计算、物联网主导的时代,平台化、生态化必然将成为企业的转型方向。由此,企业与平台合作各方的连接,企业与产业链各端的连接,都将深刻且持续地改变企业的发展轨迹。显然,这一任务的最好承担者正是大数据。
能够像Facebook、Uber一样以大数据连接企业内外各方的企业,才是数据智能的真正代表。“那些敞开大门,让数据和信息畅通无阻连接的企业,将赢得更长远的未来”,韦思岸说。
韦思岸曾在联合国的一次演讲中,把大数据比喻为新时代的石油,他认为其是21世纪最重要的原材料。韦思岸对界面新闻记者说,在未来,企业运用大数据优化战略制定与日常管理,会是一件如同企业要用电一样常态化、普遍化的事情。
大数据能为企业带来的AI、BI、CI和DI之增长动能,将是身处万物互联化、万物智能化时代的企业所必须具备的DNA。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22