京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据将不可避免地改变我们思考世界的方式
什么是大数据(Big data)?研究机构 Gartner 给出了这样的定义。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据是数据分析的前沿技术。从各种类型的数据中,快速获得有价值信息的能力,就是大数据技术,这也正是促使大数据技术具备走向众多企业的潜力。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理,通过 加工实现数据的增值。
近10年来,政府和企业在世界范围内收集了大量互联网用户的数据,不仅仅是姓名和数字,而是一连串数据---大数据。国际数据公司(International Data Corporation) 最近预测大数据行业复合年增长率将达到 26.4%,在 2018 年达到415 亿美元。这意味着越来越多的企业和组织将花费巨资研究分析大数据并获得有价值的信息。负责美国宇航局在加州帕萨迪纳市的喷气推进实验室大数据的 Chris Mattmann 表示,NASA 总共管理着几百 PB 容量的数据,几乎达到 1EB。
1 EB(Exabyte,艾可萨字节或艾字节) 是多少容量?这意味着 10 亿 GB,像这样:1000000000GB。
这些巨大的数据扩散的速度如此之快以至于传统的数据技术跟不上它们的节奏。TNS 市场研究公司 (Taylor Nelson Sofres)亚太地区首席执行官 Chris Riquier 告诉我大数据对市场研究有非常大的影响。
Riquier 表示,市场研究是建立在调研和问卷调查之上的。他讲道,在过去,调研的过程或花费数周的时间,最终用呈现的数据来分析企业规模和相关信息,通过整合社交媒体数据、搜索数据以及其他形式的大数据来做成报告,而现在我们有机会来「重新思考研究是如何完成的。」Riquier 表示,由于大数据,我们对「市场和决策力的反应已经发生了很大的变化。」
在今天的数字世界里,大数据通过跨行业、政府、科学、公共健康和学术界来发现相关性。在过去,从信息里的海洋里获得有用的数据信息对大多数人来说一直是可望而不可即的事情。直到去年,哈佛杂志在 2014 年刊登的一篇文章,标题为为什么大数据是一桩大买卖?(Why「Big Data」is aBig Deal),文中表示通过改进的统计和计算方法, 包括关联数据集、可视化数据以及创建「大算法」等这些关键的创新,能使我们快速处理这些数据并为我们所用。从物理学家到文天学家,他们长期与大数据打交道,数据科学家和社会学家通过结合定量与定性的方法来从大数据中获得有用的信息。实际上,大数据正在创造一个新领域,哈佛大学工程与应用科学学院为此开设数据科学硕士学位。
在《大数据-一场改变我们生活、工作和思考的革命》一书中,Viktor Mayer-Schonberger 和 Kenneth Cukier 谈到企业是如何改变方式来做出决策---基于对大数据的分析。例如,谷歌通过其收集的大数据来预测预测禽流感的散布,其反应速度比美国疾病控制中心还要迅速。
据《华尔街日报》最近的一篇文章,加拿大银行使用由开源软件开发商 Apache 开发的 Hadoop 来储存和处理大数据,并能识别洗钱和欺诈等犯罪行为。
大数据之于普通人
哈佛、NASA、谷歌和 Apache 利用大数据的分析能力在世界范围内带来先进的技术,但就像我之前提到的,这并不意味着科学家们能很快从大数据中受益。让我们来看一看一些企业和公司在收集和管理大数据的几个方面。
其中大数据最主要的一个用途就是在市场中的搜索引擎优化(SEO)。公司和企业能利用搜索引擎公司如谷歌和必应提供的工具,结合不同的社交媒体数据,收集有用的信息来进行网络营销。咨询公司 Hall Analysis 的研究员 Joe Hall 主要研究搜索引擎优化和大数据,他表示有两种方法能使用大数据来处理搜索引擎优化。
他说:「第一种是处理与大数据集有关联的业务。在大多数情况下这意昧着大品牌和大企业能获得非常多的数据。」Hall 引用一个例子,一个客户有 1600 万个反向链接,或者从其他网站链接指向客户的网站。这些链接对谷歌和其他搜索引擎来说是一个非常重要的排名因素。他解释说,数据集的大小需要像模式分析那样有强大的处理各种任务的能力,并在这种水准下为反向链接分析改变规则。
Hall 表示,第二种方法是公司能利用大数据使搜索引擎优化变得更具态势感知能力。这表明使用相关性研究能更好了解排名因素以及用户点击率、排名结果页面等用户行为分析。这两种分析类型都需要大数据分析来达到最终的目的,并能有效帮助 SEO 专家开阔一个「更大的局面」。
另一方面是大数据在商业活动中能获得用户的忠诚度。举个例子,比如我是一个创业公司的创始人,在我成功运作公司的第一年后,公司业绩蒸蒸日上,于是我给自己放个大假,去夏威夷度假。但在机场安检的时候,检票员告知我由于我的箱子超重,我需要付额外的费用。但是检票员可能不知道,作为一个成功创业公司的创始人和 CEO,我和我的员工将会在全世界各大城市奔波,为航空公司贡献更多的里程。如果航空公司使用大数据整合来自信用卡公司、社交媒体源、博客、酒店等相关信息,他们会可能取消这样的额外收费还能获得一个忠诚的客户。
无论是大公司的 CEO 或是研究癌症的医生,或是一个淘宝店老板,使用大数据分析都将会为他们带来有价值的信息。当我们进入到这样一个时代:基于大数据分析来作出决策,这将不可避免地改变我们思考世界的方式。
今天这一代人出生在数字化时代。而下一代人将进入大数据时代。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17