京公网安备 11010802034615号
经营许可证编号:京B2-20210330
公司如何通过大数据赚钱
现代大数据项目具备巨大的节约成本的潜力,其效果对于过去的数据处理方式而言有如童话。但需要谨记的是,在投入时间和资源到大数据项目之前,首先要确认你的项目是收益大于成本的。只有傻瓜才会匆匆对一个点子一见钟情并倾其所有。
大数据无疑是时下炙手可热的流行词汇,然而,我们鲜少看到具体大数据如何带来收益,和具体如何实现的例子,这是怎么回事呢?
多年来,在经历了几个通信和投行的大数据相关早期实施项目后,我认为这个新兴技术的收益主要在于:实现对复杂系统更为精准的剖析,例如股票市场或供应链。(投行成为最早一批应用大数据分析的行业之一,可谓毫不意外。对利用技术提升效率,创造效益更为敏锐的商业模式,往往也是更赚钱的。)
在投行的日常工作中,为了精准地选择投资机会、选购股票,有大量对文档处理的需求,例如新闻简报,财务报表。如果人工进行,工作量过于庞大。因此助理分析师们往往简化他们的预测分析过程,并使用电子表格来完成绝大部分工作。通过大数据技术,投行可以整合各种信息,减少可能的(简化分析带来的)风险,从整体上带来更优越的分析和预测能力。
公司如何通过大数据赚钱
通过大数据平台,股票经纪和投资经理们可以聚合各种来源的非格式化数据,辅助判断哪些公司值得投资。所谓‘非格式化数据’包括如公司新闻,产品评论,供应商数据,价格变化,将这些信息以所谓“大数据”形式整合,通过建模,帮助股票经纪决策买入或售出股票。
有些采用如上方式进行投资预测的公司,很注重节约实施成本,例如使用云平台(如AWS),先从很小数量的服务器开始,随着获益增长,逐步提高投入。一位我认识的分析师,从一家大投行离职创业后,在不到六个月的时间内,仅仅使用非常有限的投入,创立了一个盈利良好的大数据交易系统。
即便在传统制造领域,大数据仍然可以提升预测能力。我曾经担任过顾问的某欧洲一线汽车制造厂商,通过建立一个钢材交易成本的分析系统,选择更好的时机,以更优价格买入原材料。这个系统由开源Java框架Hadoop创建,整合了多个供应商的共计15Tb的数据,在两年内为该公司节省了1600万美元。
这个项目的成功主要有两个原因:首先,公司有足够的信息为所有的供应商建模;其次,该项目节省的原材料成本超过了实施这个项目的费用。
公司为何因为大数据亏钱
然而,并非每个大数据项目都会这样成功。公司在大数据项目上以亏损告终的概率,有时和成功的概率相差无几。大数据项目失败的早期症状有很多种,最常见的问题如:
步子迈太大:大数据并不需要一笔巨大的预算,如果怀着巨大的投入将带来巨大回报的预期开始一个大数据项目,往往会产生问题。在正式开始前,明智的做法是,尝试用有限的投入,在小范围内测试这个技术是否确实能带来预期的收益。按这样的节奏,一个项目可以按部就班地随着收益逐步提高,而逐步扩大投入规模,确保收益始终大于投入。
低估人力投入:在开始实施一个大数据系统前,问自己一个简单的问题:这个项目是否可以不需要持续的人工支持来运作?如果答案是,需要人工支持,那么建议停止项目。建立这样一个项目往往意味着百万级的损失,无法在有利润情况下保持维护和运行。
迷信自然语言处理:大数据有个经常听到的功能是,通过自然语言处理,将各种领域的各种数据处理成直接可读可理解的形式。这听起来确实很赞,但是在实际应用中,往往不尽如人意。自然语言处理仍然存在许多妨碍应用的限制,主要由于人工智能的发展还不够--而且在可见的10年内,这个情况可能不会有很大改观。
现代大数据项目具备巨大的节约成本的潜力,其效果对于过去的数据处理方式而言有如童话。但需要谨记的是,在投入时间和资源到大数据项目之前,首先要确认你的项目是收益大于成本的。只有傻瓜才会匆匆对一个点子一见钟情并倾其所有。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11在CDA(Certified Data Analyst)数据分析师的实操体系中,统计基本概念是不可或缺的核心根基,更是连接原始数据与业务洞察的关 ...
2026-02-11在数字经济飞速发展的今天,数据已成为核心生产要素,渗透到企业运营、民生服务、科技研发等各个领域。从个人手机里的浏览记录、 ...
2026-02-10在数据分析、实验研究中,我们经常会遇到小样本配对数据的差异检验场景——比如同一组受试者用药前后的指标对比、配对分组的两组 ...
2026-02-10在结构化数据分析领域,透视分析(Pivot Analysis)是CDA(Certified Data Analyst)数据分析师最常用、最高效的核心实操方法之 ...
2026-02-10在SQL数据库实操中,字段类型的合理设置是保证数据运算、统计准确性的基础。日常开发或数据分析时,我们常会遇到这样的问题:数 ...
2026-02-09