
大数据一词_谁将取而代之_数据分析师
大 数据这个关键词从去年红到今年,早已成为科技业的重要趋势,研调机构IDC便预测2015年将有超过25%的企业导入大数据方案,而美国专业招聘公司罗致 恒富(Robert Halt)公布的《2015薪资指南(2015 Salary Guide》更把大数据工程师列为今年薪资涨幅最大的六大行业之一,预计薪资年成长率9.3%,平均年薪119,250美元至168,250美元。
据美国大数据分析与储存技术公司Teradata首席CTO宝立明(Stephen Brobst)表示:他认为大数据这个词将会在五年内消失,并认为从物理学家到社会学家都会是优秀的数据科学家,以下为宝立明专访的内容摘要:
1. 大数据这个词近年来非常火红,但也有人认为大数据已处在泡沫期,您怎么看这种人人高喊大数据的现象?
我承认现在整个社会上弥漫着一股大数据热潮,但我认为这不失为一种好现象,因为这让大家注意到这个世界上还有许多尚未被挖掘,并且充满价值的数据,我认为在这股热潮当中,其实是有黄金的,但就像你说的,其实还是有很多人不知道大数据是什么意思,更不知道怎么用他。
他 们以为大数据就是指大数目的数据,事实上,我认为这是大数据中最无趣的部分,我们真正在寻找的是非传统的、而且未曾被挖掘过的数据,并且从这些数据中去提 炼出价值,我相信在五年内我们就不会再使用”大数据”这个词了,到头来大数据就只是数据而已,不是吗?数据是很重要,但是这个世界上还有一大堆以往根本不 被视为是数据的数据在那边等着我们挖掘,到最后,人们会开始回头分析这些资料,他们会发现,大数据不过就只是数据的一种,大数据、小数据、结构化、非结构 化的数据...这些称呼通通都不重要,因为这些都是数据啊,这是我认为为什么到最后大数据这个词汇将会退烧的原因。
2. 你认为数据经济以后将会成为每个企业的DNA吗?
是 的没错,人们将会依据一家公司是否有效地运用数据,来定义这家公司是否成功。大数据这个词也许是三年前才出现的,但其实它早在十年前就有了,概念比名词出 现得更早,在八年前发生了一个比较重大的转变,人们从研究一笔交易变成研究互动,我们开始往下钻研,不只研究一笔交易,更研究真实的顾客体验,因此我认为 虽然不是每一个,但许多大数据应用必须要能够更妥善了解顾客的行为和体验。
我认为大数据发展可以分成三阶段:
第一阶段是.com时期,人们研究log资料,搜集人们的Cookie和搜寻行为等等,这类分析已经存在很久了,我们不只知道使用者买了什么东西而已,而是更深层地去分析行为,一笔交易只告诉我价值,但没有告诉我顾客体验,大数据想要去分析的是顾客体验。
第二阶段是社交网站,这也是我们现在正在经历的阶段,我们分析Facebook、Twitter、部落格文章...等等等,这可以帮助我们进一步了解顾客行为。
第 三阶段是物联网,这是我觉得最有趣的阶段,有些企业已经开始分析来自传感器的数据了,在这边我说的物联网不只是穿戴式设备或智能家庭而已,我说的是机器与 机器之间的沟通,这些数据的价值很值得被研究。现在制造业都会订下一些规矩,例如我们的汽车每半年就要进厂维修,就跟人每年都要去做健康检查一样,我认为 这是非常过时的想法,一旦我们用传感器去搜集引擎、汽车和生理数据,我们就可以精确知道何时需要进厂维修或做健康检查,这就叫做预测性维修 (condition based maintenance),这个概念对于促进顾客体验、效益和健康保险等领域非常重要。
3.你对大数据的定义是什么?
一 般来说我们用3V定义大数据,容量(Volume)、快速(Velocity)与多样性(Variety),其中我认为最重要的是多样性,数据不只来自那 些传统管道,有更多来自非传统管道的非传统数据产生,我认为价值(Value)是第四个V,人们常常忘了这件事,他们专注于技术,却忘了创造价值,但这却 是一个大数据计划能否成功的关键:这不只关乎技术,而是你能用技术创造出什么价值。
4.有许多中小企业,许多中小企业也许认为大数据是个离他们很遥远的概念,因为他们根本没有”大数据”,您会给他们什么样的建议?
这 些小企业一看到大数据就会想说,喔这一定是很大的数据才有办法做,但数据的量其实从来都不是重点,我认为”大数据”是个非常差劲的命名,因为它让人们直接 联想到”大”,但数据的大小其实是最无趣的部分,最重要的其实是那些你从来没有想过可以用的数据以及那些非传统的数据,我认为这才是人们对大数据应有的认 知。
有许多新创企业在思考如何用大数据创造全新的商业模式,例如硅谷最近有一个正在做P2P交易服务的新创公司,比如说我们一起去吃午 餐,你买单,然后我透过手机给你我的部份的钱,这不是什么新的概念,但这家公司有趣的地方他不收任何手续费,而银行一点都不喜欢这个主意,你知道现在的银 行交易都必须额外负担手续费,银行于是说:”你怎么可以完全不收手续费?”这家公司说,因为这些事务数据本身的价值远远超过手续费本身。
从 此之后,这家公司会知道你我之间有一种连结,如果我们每个礼拜五都出去吃饭,他们就可以判断我们之间有强烈连结,如果我们一个月或一年才吃一次,那么也许 我们之间的连结比较弱,这家公司可以藉此判断人与人之间的关系强弱,你也许会说:那又怎么样?这可以干嘛?这家公司将会知道谁是社交意见领袖,如果他要卖 新产品,他可以先从这些人开始着手,例如我也许会买他的东西,但我没有朋友(笑)所以它就只能卖出一项产品,但你有一百个朋友,你也许是个疑心病比较重的 人,所以我要花比较多功夫来说服你买东西,但你一旦用了而且觉得好用,那么你很有可能会将这个讯息散播给你其他一百个朋友,那我搞不好可以再多卖50个产 品,这就是一个善加利用社交数据,而且突破旧有思考模式的例子。
5. 如何用大数据创造商业模式?
这是个颇为复杂的问题,因为大 数据是由很多不同元素组成的,我会把大数据认定为是比交易系统更深一层的互动分析,首先,如果你有一笔订单,你就得到了顾客的价值,但你无法了解他们为什 么如此行动,如果我能够了解他们的行为喜好,我就可以创造更好的顾客体验,我创造了更好的顾客体验,他们就会越买越多,他们会停留更久,如此我当然就可以 创造一个非常强大的商业模式。
基本上所有的电商网站都在做这件事情,因为电商网站无法直接与顾客接触,所以他们必须透过分析数据来与顾客 建立关系,这是个很显而易见的商业模式,如果你不分析数据去改善顾客经验,顾客就会离你而去。如果就制造业来说,预测性维修是比较常见的大数据商业模式, 这跟传统的维修模式全然不同,这当中的经济价值差异是数以千万的美元,就算对中小型企业亦然,如果你知道这些企业每年花多少钱在维修设备和安全改善,你就 应该知道预测性维修是门好生意。
6.这些对企业来说是技术层次的问题,但商业嗅觉是否才是如何让大数据变现的关键?
是的,我称之 为直觉,你为了验证你的假说,于是你设计了一个实验模型,如果你没有商业嗅觉,你很可能会实验了一千次但得到很差的结果,我相信你一定有听过这个笑话:” 一百万只猴子也可以写出莎士比亚等级的著作,只是我们要等很久而已。”你放猴子在那边一直打字,总会有好的产出的,但这其实不太好,对吧?所以我认为还是 需要具备一定的商业眼光。
好的数据科学家和不好的数据科学家的差别就在于他们的商业眼光,我认为这不只是管理阶级的职责,而是一个数据科学家的职责之一。
7.大数据项目牵涉到许多跨部门的协作,而不只是IT部门的事,你认为这会更像是一个管理问题而非技术问题吗?
我 的确观察到许多只专注在技术层面的公司,他们的大数据表现通常都不怎么好,管理者必须确保你在埋首进行的事是有商业价值的,而不只是在玩技术而已,在麻省 理工学院有个词用来形容这些只埋头搞技术的人:追随流行者(Fashionist),这些人盲目追随科技新潮流,看到云端运算就赶快跑去搞云端运算,噢看 那边是大数据耶,大家都有我们一定也要有! 他们不知道为什么需要,只是因为大家都有,他们就要有,这不是一个好策略。
你必须要思考:这有什么商业价值?为什么我需要做这个?所以那些最成功的大数据项目都是由技术部门和商业部门协作而成的,只有技术人员是不可能成功的,但同样地,只有业务部门也不会成功,他们必须在一起才能创造价值。
而 数据分析的技术的关键在于,你是否有用对技术,这是许多公司低估的地方,有很多公司混淆了做报告和分析数据的人。比如说美国的教育很重视数学,但我们的统 计学教得一蹋胡涂,统计学对于数据分析非常重要,很多人高中毕业后也许几何、微积分很厉害,但他们连最基本的期望值理论都不懂,他们也不懂交叉分析,但这 些技能对于分析数据都是非常重要的,我认为我们的教育体系和企业在培育拥有这方面技能的人才上,投资得太少了。
近年来有很多大学开始开设数据分析课程,我觉得这是一件好事,但问题是等这些人才毕业了,到时候我们对大数据人才的需求已经远远超过供给了。
8. 你认为现在要寻找优秀的数据分析学家很困难吗?
人们常常把计算机科学家和数据科学家混为一谈,数据科学家不一定非得要写程序才能分析数据,当然你不应该害怕科技,如果你害怕新科技那你就不是那个对的人,你需要会使用科技,但重点其实还是在数据,你要会设计实验、熟悉数学和统计、如何获取资料和得到结果...等等等。
当 然,数学系毕业的人是很好的选择,但我的经验是毕业自实验性科学科系的人也会成为很好的数据科学家,例如:应用物理系、化学系、天文系...等等,因为他 们知道怎么设计实验、怎么搜集数据和得到结果,这让他们成为优秀的数据科学家。在麻省理工学院我们有个笑话,物理系毕业的人如果不去教物理,他们就失业 了。因为除了教物理你还能干嘛?但现在物理系的人也会是很好的数据科学家,例如eBay最优秀的数据科学家就是物理学家。
你看事情的眼光还需要充满创意,所以社会学出身的人也会是很好的数据科学家,很多社会学家必须做调查,并且从中搜集和调查数据,这已经具备了数据科学家该有的特质了。但如果你不具备这种分析数据的背景的话,可能就不是那么好的候选人了。文章来源:CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
透视表内计算两个字段乘积的实用指南 在数据处理与分析的过程中,透视表凭借其强大的数据汇总和整理能力,成为了众多数据工 ...
2025-06-20CDA 一级考试备考时长全解析,助你高效备考 CDA(Certified Data Analyst)一级认证考试,作为数据分析师领域的重要资格认证, ...
2025-06-20统计学模型:解锁数据背后的规律与奥秘 在数据驱动决策的时代,统计学模型作为挖掘数据价值的核心工具,发挥着至关重要的作 ...
2025-06-20Logic 模型特征与选择应用:构建项目规划与评估的逻辑框架 在项目管理、政策制定以及社会服务等领域,Logic 模型(逻辑模型 ...
2025-06-19SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的利器 在数据分析的众多方法中,Mann-Kendall(MK)检验凭借其对数据分 ...
2025-06-19CDA 数据分析能力与 AI 的一体化发展关系:重塑数据驱动未来 在数字化浪潮奔涌的当下,数据已然成为企业乃至整个社会发展进 ...
2025-06-19CDA 干货分享:统计学的应用 在数据驱动业务发展的时代浪潮中,统计学作为数据分析的核心基石,发挥着无可替代的关键作用。 ...
2025-06-18CDA 精益业务数据分析:解锁企业增长新密码 在数字化浪潮席卷全球的当下,数据已然成为企业最具价值的资产之一。如何精准地 ...
2025-06-18CDA 培训:开启数据分析师职业大门的钥匙 在大数据时代,数据分析师已成为各行业竞相争夺的关键人才。CDA(Certified Data ...
2025-06-18CDA 人才招聘市场分析:机遇与挑战并存 在数字化浪潮席卷各行业的当下,数据分析能力成为企业发展的核心竞争力之一,持有 C ...
2025-06-17CDA金融大数据案例分析:驱动行业变革的实践与启示 在金融行业加速数字化转型的当下,大数据技术已成为金融机构提升 ...
2025-06-17CDA干货:SPSS交叉列联表分析规范与应用指南 一、交叉列联表的基本概念 交叉列联表(Cross-tabulation)是一种用于展示两个或多 ...
2025-06-17TMT行业内审内控咨询顾问 1-2万 上班地址:朝阳门北大街8号富华大厦A座9层 岗位描述 1、为客户提供高质量的 ...
2025-06-16一文读懂 CDA 数据分析师证书考试全攻略 在数据行业蓬勃发展的今天,CDA 数据分析师证书成为众多从业者和求职者提升竞争力的重要 ...
2025-06-16数据分析师:数字时代的商业解码者 在数字经济蓬勃发展的今天,数据已成为企业乃至整个社会最宝贵的资产之一。无论是 ...
2025-06-16解锁数据分析师证书:开启数字化职业新篇 在数字化浪潮汹涌的当下,数据已成为驱动企业前行的关键要素。从市场趋势研判、用 ...
2025-06-16CDA 数据分析师证书含金量几何?一文为你讲清楚 在当今数字化时代,数据成为了企业决策和发展的重要依据。数据分析师这一职业 ...
2025-06-13CDA 数据分析师:数字化时代的关键人才 在当今数字化浪潮席卷全球的时代,数据已然成为驱动企业发展、推动行业变革的核心要素。 ...
2025-06-13CDA 数据分析师报考条件全解析 在大数据和人工智能时代,数据分析师成为了众多行业追捧的热门职业。CDA(Certified Data Analyst ...
2025-06-13“纲举目张,执本末从。”若想在数据分析领域有所收获,一套合适的学习教材至关重要。一套优质且契合需求的学习教材无疑是那关键 ...
2025-06-09