
你所不知道的大数据、云计算,以及无法计算的价值
毫不吹牛的说,单凭这个标题,就能让这篇文章装着13轻轻松松过大年。但凡有不服者,请你告诉我旁边的这位大婶儿,什么叫大数据,什么是云计算。你要能让大婶儿听明白了,我就服你。认怂了吧?来,看我的。
不管你能不能看见,这都是一个全新的世界
1590年,有一个名叫札恰里亚斯·詹森的荷兰眼镜制造商人,发明了一种借助物理方法使物体放大影象的仪器,名曰显微镜,从此,人类看到了一个全新的世界,走入原子时代。
1609年,有一个名叫伽利略的人,用平凸透镜作为物镜,凹透镜作为目镜,制作了一架口径4.2厘米,长约1.2米的望远镜。他用这架望远镜指向太空,看到了一个全新的世界,天文学从此进入了望远镜时代。
1842年,有一个名叫多普勒的奥地利物理学家,率先提出利用多普勒效应的多普勒式雷达。雷达的英文直译是“无线电探测和测距”,即用无线电的方法发现目标并测定它们的空间位置,因此雷达也被称为“无线电定位”。
伽里略发明天文望远镜,让人类突然意识到世界不是原来眼睛看到的那样。需要明确一点,人类不是因为知道世界是什么样而去发明了望远镜,而是因为有了望远镜,才知道世界是什么样。显微镜也是一样的道理,当你离开显微镜的时候,你要想一想通过显微镜看到的那个世界是不是真实存在。
给你12秒,想一想……
你想的都对!互联网、数据和计算,就像人类历史上三个非常重要的工具——望远镜、显微镜和雷达的发明,让人类看见了原来看不见的世界,看见了历史上没有见过的东西。
能说出这么深入浅出的道理,自然不是我,而是阿里巴巴CTO王坚博士。王坚博士被业界誉为云计算的布道者,在近年来的公开演讲中多次阐述他对互联网、计算和数据的理解。1月20日,云栖大会上海峰会召开,王坚博士在主题演讲中表示,现在人们看数据都是通过计算去看,就像人类发明显微镜以后,研究微观世界都是通过显微镜看到的。同理,我们要相信那个人眼看不见的、被计算出来的数据世界。
他说,“传统行业或者传统软件公司不觉得鼠标点击有意义有价值,不觉得那是一个活生生的世界,但是互联网是把它当生命来看。在互联网上点击鼠标就能知道用户的兴趣,能创造价值,这是互联网公司真正的能力,而不是别的东西,这是显微镜的作用。”
想不想在数据时代也能分得一杯羹?
不得不承认,王坚博士总是能用大婶儿都能理解的语言,完美解释无比高深的科学问题。
在谈到数据的时候,他说,因为互联网这个基础设施的存在,数据就像土地、石油、煤一样,成为了DT时代的生产资料。为了利用好数据这一生产资料,发挥出数据的巨大价值,他号召在场的每一人学习小岗村的农民,做互联网时代地球村的“数据农民”。
“关于数据这件事情,大家都处于像中国三十年前改革开放的起点,不知道土地上种什么,种的东西不知道是谁拥有的。”王坚强调,“在座的各位有一次机会,我们一起为全世界做一次小岗村农民做的事情,思考如何让土地产生价值,如何让数据产生价值,并且产生的价值不会有纠纷,所有权清晰。这是数据产业非常重要的机会。”
王坚认为,当互联网变成基础设施、数据成为生产资料、计算成为公共服务的时候,所有的企业、所有的行业又站在同一条起跑线上:个人创业者的影响力可以和一万人的大公司影响力相比,而一万人的大公司又具备了小公司的灵活性。
说的这么好,如何才能成为数据时代的数据农民呢?据说下面这个叫做“数加”的家伙可以帮到你。
带你看懂全球首个一站式大数据平台“数加”
有人说,2016年才是真正意义上的大数据元年。这句话听着好熟悉……
在过去的5年里,全球大数据计算性能实现了超过20倍的增长,100TB数据排序时间由8274秒缩短到377秒。束缚大数据的技术瓶颈已经被完全打破,数据将从企业的成本中心转变为价值中心。
与此同时,IDC出版的数字世界研究报告显示,2013年人类产生、复制和消费的数据量达到4.4ZB。而到2020年,数据量将增长10倍,达到44ZB。大数据已经成为当下人类最宝贵的财富。但全球真正享受大数据红利的公司不足千分之一,人类已挖掘的数据财富更是不到百万分之一。
没错,这是一个人人都在谈大数据的时代,每年都谈,谈了好几年了,但是,真正在用大数据的却只有极少数人。为什么呢?说来话长,暂且不表。今天说一说,为啥2016才是真正的大数据元年,因为有了“数加”。
1月20日的云栖大会上海峰会上,阿里云宣布开放阿里巴巴十年的大数据能力,发布全球首个一站式大数据平台“数加”,首批亮相20款产品,覆盖数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等数据生产全链条。“这些技术至少领先业界三年”,阿里云大数据事业部资深总监徐常亮说。
这个平台承载了阿里云“普惠大数据”的理想——让全球任何一个企业、个人都能用上大数据。
开放、开放、开放,重要的事情说三遍
过去10年来,阿里巴巴积累了令行业艳羡不已的庞大数据,那就是一笔巨大的财富,就像煤炭一样,趴在你家山头下面。那么,突然有一天,你说大家都来一起开采吧,对外开放,情形会怎样呢?
“数加”就是要把阿里巴巴的大数据向外界开放。据了解,“数加”正在向有数据开发能力的外界的第三方团队开放,这些团队可入驻“数加”,借助数加上的工具为各行各业提供数据服务。
“这就像在淘宝开店一样,只是他们售卖的是专业能力。”徐常亮表示,阿里云计划用3年时间吸引1000家合作伙伴入驻,共同分享1万亿的大数据蛋糕。
借助大数据技术,阿里巴巴取得了巨大的商业成功。通过对电子商务平台上的客户行为进行分析,诞生了蚂蚁小贷、花呗、借呗;菜鸟网络通过电子面单、物流云、菜鸟天地等数据产品,为快递行业的升级提供技术方法。
在这些创新中,“数加”承载了阿里巴巴EB级别的数据加工计算,经历了上万名工程师的实战检验。大麦网是阿里云“数加”平台的尝鲜者。通过采用“数加”的推荐引擎,大麦网的研发成本从900人天降低到了30人天,效率提升了30倍。
大数据喊了那么多年,阿里云开始带大家真刀真枪地玩
“过去6年来,阿里巴巴巨大的战略投资就是放在云计算和大数据服务上。我们相信人类已经从IT时代在步入DT时代。”马云在2015年致投资者公开信中表示,“我们必须在数据技术的投入和发展上不惜一切的投入发展,我们正在努力让数据和计算能力成为普惠经济的基础。”
马云所说的DT技术正在通过“数加”变现,这个集成了人工智能、机器学习、智能语音等前沿技术的阿里云大数据平台,让没有足够技术实力的公司,也能实现从数据中提炼“石油”。
“未来3年,大数据市场规模将达到1万亿元。”阿里云总裁胡晓明在发布会上表示,基于阿里云大数据平台数加,将有千余家合作伙伴、万名首席数据官和5万数据科学家诞生,把中国大数据市场规模拓展至万亿规模。
“大数据”一词近年来在中国十分火热,但真正的数据技术和工具平台一直缺位。“中国的数据技术起步比硅谷晚,但我们看到互联网巨头们正在大量投入研发力量,来缩短差距。”Alliance Development Group分析师David Sullivan表示,以阿里巴巴为典型的中国互联网公司正在自己的商业场景中大规模使用数据技术,技术上与硅谷几乎没有差距。
在发布会上,阿里云提及去年年底刚刚刷新的一项世界纪录。在由数据库之父Jim Gray创办的排序基准评估竞赛Sort Benchmark中,阿里云把100TB数据的排序时间缩短到了377秒,打破了此前由雅虎、微软、斯坦福大学等公司与机构保持的纪录。
“数加”教你一星期做出双11同款大屏
去年双11,北京水立方的那块巨大无比的直播大屏幕,想必大家都在新闻报道的配图里见过了吧,实时展现阿里巴巴整体交易数据,可视化效果,绝对震撼。想不想也来一块?
“数加”之后,中国的县长们也能实现这样的可视化管理了。云栖大会上海峰会上,阿里云发布了一款针对中国县域经济的数据应用产品,能让每个县域的管理者实时的了解区域的经济态势、产业特点、内需消费等关键数据的走势,为政府决策提供支持,堪称“师爷”。
据了解,这款命名为“郡县图治”的产品,使用了阿里云DataV数据可视化技术做支撑,将为3000余个县域政府定制可视化经济云图。今后,县域经济的决策者办公室里,可能将出现这样一块大屏,上面的每一个数字的跳动都实时反映着当地县域经济的发展态势,县长们也不用再从厚厚的定期报表中探寻经济发展的脉搏。
开发这样一款”酷炫“的大屏需要多久?只要一周!阿里云工程师介绍,这款产品无需进行任何的编程,只需进行简单的部署、参数设置、数据连接,便可让枯燥的统计数据直观的呈现出来,帮助县域经济决策者们快速发现问题作出决断。
“我们希望通过数加的发布,让政府、企业、个人都能享受到大数据的红利
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03