
大数据将不可避免地改变我们思考世界的方式
什么是大数据(Big data)?研究机构 Gartner 给出了这样的定义。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据是数据分析的前沿技术。从各种类型的数据中,快速获得有价值信息的能力,就是大数据技术,这也正是促使大数据技术具备走向众多企业的潜力。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理,通过 加工实现数据的增值。
近10年来,政府和企业在世界范围内收集了大量互联网用户的数据,不仅仅是姓名和数字,而是一连串数据---大数据。国际数据公司(International Data Corporation) 最近预测大数据行业复合年增长率将达到 26.4%,在 2018 年达到415 亿美元。这意味着越来越多的企业和组织将花费巨资研究分析大数据并获得有价值的信息。负责美国宇航局在加州帕萨迪纳市的喷气推进实验室大数据的 Chris Mattmann 表示,NASA 总共管理着几百 PB 容量的数据,几乎达到 1EB。
1 EB(Exabyte,艾可萨字节或艾字节) 是多少容量?这意味着 10 亿 GB,像这样:1000000000GB。
这些巨大的数据扩散的速度如此之快以至于传统的数据技术跟不上它们的节奏。TNS 市场研究公司 (Taylor Nelson Sofres)亚太地区首席执行官 Chris Riquier 告诉我大数据对市场研究有非常大的影响。
Riquier 表示,市场研究是建立在调研和问卷调查之上的。他讲道,在过去,调研的过程或花费数周的时间,最终用呈现的数据来分析企业规模和相关信息,通过整合社交媒体数据、搜索数据以及其他形式的大数据来做成报告,而现在我们有机会来「重新思考研究是如何完成的。」Riquier 表示,由于大数据,我们对「市场和决策力的反应已经发生了很大的变化。」
在今天的数字世界里,大数据通过跨行业、政府、科学、公共健康和学术界来发现相关性。在过去,从信息里的海洋里获得有用的数据信息对大多数人来说一直是可望而不可即的事情。直到去年,哈佛杂志在 2014 年刊登的一篇文章,标题为为什么大数据是一桩大买卖?(Why「Big Data」is aBig Deal),文中表示通过改进的统计和计算方法, 包括关联数据集、可视化数据以及创建「大算法」等这些关键的创新,能使我们快速处理这些数据并为我们所用。从物理学家到文天学家,他们长期与大数据打交道,数据科学家和社会学家通过结合定量与定性的方法来从大数据中获得有用的信息。实际上,大数据正在创造一个新领域,哈佛大学工程与应用科学学院为此开设数据科学硕士学位。
在《大数据-一场改变我们生活、工作和思考的革命》一书中,Viktor Mayer-Schonberger 和 Kenneth Cukier 谈到企业是如何改变方式来做出决策---基于对大数据的分析。例如,谷歌通过其收集的大数据来预测预测禽流感的散布,其反应速度比美国疾病控制中心还要迅速。
据《华尔街日报》最近的一篇文章,加拿大银行使用由开源软件开发商 Apache 开发的 Hadoop 来储存和处理大数据,并能识别洗钱和欺诈等犯罪行为。
大数据之于普通人
哈佛、NASA、谷歌和 Apache 利用大数据的分析能力在世界范围内带来先进的技术,但就像我之前提到的,这并不意味着科学家们能很快从大数据中受益。让我们来看一看一些企业和公司在收集和管理大数据的几个方面。
其中大数据最主要的一个用途就是在市场中的搜索引擎优化(SEO)。公司和企业能利用搜索引擎公司如谷歌和必应提供的工具,结合不同的社交媒体数据,收集有用的信息来进行网络营销。咨询公司 Hall Analysis 的研究员 Joe Hall 主要研究搜索引擎优化和大数据,他表示有两种方法能使用大数据来处理搜索引擎优化。
他说:「第一种是处理与大数据集有关联的业务。在大多数情况下这意昧着大品牌和大企业能获得非常多的数据。」Hall 引用一个例子,一个客户有 1600 万个反向链接,或者从其他网站链接指向客户的网站。这些链接对谷歌和其他搜索引擎来说是一个非常重要的排名因素。他解释说,数据集的大小需要像模式分析那样有强大的处理各种任务的能力,并在这种水准下为反向链接分析改变规则。
Hall 表示,第二种方法是公司能利用大数据使搜索引擎优化变得更具态势感知能力。这表明使用相关性研究能更好了解排名因素以及用户点击率、排名结果页面等用户行为分析。这两种分析类型都需要大数据分析来达到最终的目的,并能有效帮助 SEO 专家开阔一个「更大的局面」。
另一方面是大数据在商业活动中能获得用户的忠诚度。举个例子,比如我是一个创业公司的创始人,在我成功运作公司的第一年后,公司业绩蒸蒸日上,于是我给自己放个大假,去夏威夷度假。但在机场安检的时候,检票员告知我由于我的箱子超重,我需要付额外的费用。但是检票员可能不知道,作为一个成功创业公司的创始人和 CEO,我和我的员工将会在全世界各大城市奔波,为航空公司贡献更多的里程。如果航空公司使用大数据整合来自信用卡公司、社交媒体源、博客、酒店等相关信息,他们会可能取消这样的额外收费还能获得一个忠诚的客户。
无论是大公司的 CEO 或是研究癌症的医生,或是一个淘宝店老板,使用大数据分析都将会为他们带来有价值的信息。当我们进入到这样一个时代:基于大数据分析来作出决策,这将不可避免地改变我们思考世界的方式。
今天这一代人出生在数字化时代。而下一代人将进入大数据时代。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-08-07SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-07大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-07解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-07CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-07通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-07评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-07CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-07反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-07