京公网安备 11010802034615号
经营许可证编号:京B2-20210330
“大数据”时代浓浓的统计学气息
统计学在近几年的变化,可以说受计算机的影响最为强烈。
计算机使商业模式发生了翻天覆地的变化。商品的采购、库存、销售等记录基本上全都已经数据化,成本和销量的把控与用纸笔进行管理的时代相比也变 得更加简单。顾客资料与消费记录、工作人员的工作时间与评定、健康状态、支付的报酬与成本核算等信息,都可以存储在公司内部系统和Excel电子表格中。 为了生产而进行的机械操作、到自己公司网站的链接,基本上所有的登录情况都会被记录下来,必要时可以综合统计作为经营的参考。就算说那些大型公司几乎所有 的业务流程已经全部实现电子化,也不为过。
但是,当一系列的业务都实现计算机化之后,那些从事计算机业务的企业却遭遇了瓶颈。不管他们如何提高硬件和软件的处理性能,如果需要计算机化的 业务流程没有增加,顾客对性能没有特别需求,那么他们就无法继续销售自己的商品。所以,不管是硬件厂商还是软件厂商,还是使用这些提供计算机服务的厂商, 所有与计算机相关的企业,都必须对已经得到满足的顾客们,提供一个购买他们更新技术的“理由”。
从好的方面来看,要想将已经足以满足顾客需要的性能更好地加以利用,就要考虑“如何创造更多的价值”。而实际上,计算机企业所考虑的是向顾客传 达“为了找出创造更多价值的方法,必须进行大量的数据处理”,为了让顾客接受这一提议,必须有一个“明显对商业有价值的理由”。
以现在的计算机技术来看,不管是多么庞大的数据量或者多么繁杂的计算都能够胜任,因此需要考虑的问题就变成了应该针对什么进行计算,而答案除了 统计分析之外再无其他。当然,如果只是将“统计分析”这个简单的词语作为题目,会让人感觉缺乏吸引力,于是就诞生出“大数据”和“商务智能”的概念。现在 大家之所以都对这两个题目和统计学如此关注,恐怕就是出于上述原因。
计算机行业的业界巨人,在弗明汉研究使用穿孔卡片和大型计算机时代就为其提供技术支持的IBM公司在这一点上表现得最为突出。IBM斥资数十亿 美元收购了在商务智能方面非常有名的Cognos公司,以及开发统计分析软件的SPSS公司,这两家公司都是在这一领域拥有丰富经验和影响力的公司。据说 2005~2011年之间,IBM公司对统计学和商务智能相关企业的投资金额已经超过140亿美元。
除了IBM之外,微软公司以及在数据库领域非常有名的甲骨文公司,还有NTT数据公司,都开始积极地收购与统计学和商务智能相关的企业。
或许这几家公司都已经发现,在接下来的时间里从自己的商业领域产生价值的主营产业,都在其中。
最能够证明这一推测的根据,来自于微软在专门用于招聘的网页上于2010年8月23日发表的一篇文章,其中提到技术领域今后最热门的3个专业,如下所示。
数据分析、机械学习、人工智能、自然语言处理。
商务智能、竞争分析。
分析、统计——特别是网页分析、分离测试(A/B测试)、统计分析。
只要是学过“计算机统计学”知识的人,都能够从上述内容里感觉到浓浓的统计学气息吧。
为了再现人类的认知机能,而从计算程序算法研究发展而来的机械学习与人工智能领域,如今若是没有统计学的理论基础就很难深入学习,至于商务智能 则完全可以说是统计学在商业领域的应用。要想完成A/B测试的计划,20世纪中叶现代统计学之父罗纳德·艾尔默·费希尔所完成的被称为“试验设计”的统计 学相关知识,则是最为重要的基础。
未来10年最受欢迎的职业是统计
另外,谷歌(Google)则比微软更加明确地表达了对统计学家的赞誉。谷歌的首席经济学家哈尔·范里安博士曾经在2009年1月麦肯锡公司发行的杂志上这样说道:
我一直坚信,未来10年最受欢迎的职业是统计。
最近,美国人经常使用“sexy”这个词来表达“受欢迎的”或者“有魅力的”,比如,“新款苹果手机的设计非常sexy”。哈尔认为统计学家也是“sexy”的。
作为一名统计学家,我对于哈尔的发言感到非常光荣,而且这绝对不是什么只停留在口头上的赞誉。统计学如今已经得到了计算机这个强有力的伙伴,可以被应用在所有领域,可以出现在世界上的每一个角落,以及人生中的每一个瞬间,能够对所有渴望得到回答的问题给出最佳答案。
曾经人类为了得到(自认为)正确的答案而只能寻求神的启示,后来在漫长时间中只能服从权威人士的意见。
但是,现在的情况不一样了。最佳答案就存在于每个人周围的数据之中。只要掌握统计学这个最强的学问,不管是想要健康、聪明,还是富裕,都变得非常简单。正如之前所说过的那样,这是世界上的学者们通过统计学证明的事实。
而想掌握这个最强、最受欢迎的学问,不必像IBM那样支付数额庞大的资金,只要在你的人生中投入一些学习时间就足够了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08在数据驱动决策的链路中,统计制图是CDA(Certified Data Analyst)数据分析师将抽象数据转化为直观洞察的关键载体。不同于普通 ...
2026-01-08在主成分分析(PCA)的学习与实践中,“主成分载荷矩阵”和“成分矩阵”是两个高频出现但极易混淆的核心概念。两者均是主成分分 ...
2026-01-07在教学管理、学生成绩分析场景中,成绩分布图是直观呈现成绩分布规律的核心工具——通过图表能快速看出成绩集中区间、高分/低分 ...
2026-01-07在数据分析师的工作闭环中,数据探索与统计分析是连接原始数据与业务洞察的关键环节。CDA(Certified Data Analyst)作为具备专 ...
2026-01-07在数据处理与可视化场景中,将Python分析后的结果导出为Excel文件是高频需求。而通过设置单元格颜色,能让Excel中的数据更具层次 ...
2026-01-06在企业运营、业务监控、数据分析等场景中,指标波动是常态——无论是日营收的突然下滑、用户活跃度的骤升,还是产品故障率的异常 ...
2026-01-06