京公网安备 11010802034615号
经营许可证编号:京B2-20210330
什么是“大数据”的真正含义_数据分析师
大数据是时下流行语,但它真正的意思是什么呢?是当数据成为大吗?
最近在波士顿举行的一个大数据和高性能计算峰会上,亚马逊网络服务(AWS)、大数据科学家JohnRauser提到一个简单的定义:任何超过了一台计算机处理能力的庞大数据量。
有人说这个定义过于简单化,有人认为一语道破大数据天机。
"大数据是最大的宣传技术、是最时髦的技术,当这种现象出现时,定义就变得很混乱。"一研究小组的发言人谈到。
"这一不成熟的市场,缺乏一个标准的定义"IDC研究公司业务分析部门的副总裁DanVesset说。但是,他也不是很赞同AWS的定义,"我想看得到的是真正的谈到数据,而不是用基础设备来处理数据。"他说。
其他人同意AWS的定义
"它可能不包含所有的信息,但我觉得大部分是正确的。"一个大数据分析师JeffKelly说。对大数据的一部分认知在于,它是如此之大,分析它需要多个工作负载,这是AWS的定义。"当你的技术达到极限时,也就是数据的极限。"Kelly说。
最常见定义大数据使用的三个术语都含有字母"V":volume,velocity和variety.许多数据公司、分析公司都会为围绕这个定义展开,如IBM、IDC。数量意味着生成和组织大量收集的数据;速度是指音频、视频、网络日志亦或更多的数据文本要进行收集和分析。
但也有一些人怀疑这一定义,Breen加了第四个"V":vendor。
如AWS和IBM的公司,他们对大数据的定义很大程度上是为了支持他们公司自身的产品。Breen说。
亚马逊发言人TeraRandall写道:"云提供即时的可扩展性和弹性服务,让您专注于分析,而不是基础设施建设。它增强你通过快速获取数据来处理和分析数据的能力。"Randall对数据的描述不见得是AWS的定义,但却是企业管理中经常会遇到的数据处理问题。
"大数据分析在云应用中是一个新兴的市场。"Kelly说。谷歌最近也发布了基于云的数据分析工具BigQuery。IBM则表示信息是"21世纪的石油"它推动业务决策跨不同行业而向前发展。
IDC称,大数据是一个很大的市场。IBM称,IDC预计到2015年企业将投资超过1200亿美元在基于数据业务分析的硬件、软件以及服务领域。IDC还表示:在整个IT和通信业务中,大数据的市场将增长7倍之多。
但是,IDC的研究人员Vesset说,大数据不是关于如何定义,最重要的是如何使用。最大的挑战在于哪些技术能更好的使用数据以及大数据的应用情况如何。这与传统的数据库相比,开源的大数据分析工具的如Hadoop的崛起,这些非结构化的数据服务的价值在哪里。
如何定义大数据到目前为止仍然没有具体的标准形态,也许,kelly的定义是最贴切的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17