京公网安备 11010802034615号
经营许可证编号:京B2-20210330
“大数据”时代浓浓的统计学气息
统计学在近几年的变化,可以说受计算机的影响最为强烈。
计算机使商业模式发生了翻天覆地的变化。商品的采购、库存、销售等记录基本上全都已经数据化,成本和销量的把控与用纸笔进行管理的时代相比也变 得更加简单。顾客资料与消费记录、工作人员的工作时间与评定、健康状态、支付的报酬与成本核算等信息,都可以存储在公司内部系统和Excel电子表格中。 为了生产而进行的机械操作、到自己公司网站的链接,基本上所有的登录情况都会被记录下来,必要时可以综合统计作为经营的参考。就算说那些大型公司几乎所有 的业务流程已经全部实现电子化,也不为过。
但是,当一系列的业务都实现计算机化之后,那些从事计算机业务的企业却遭遇了瓶颈。不管他们如何提高硬件和软件的处理性能,如果需要计算机化的 业务流程没有增加,顾客对性能没有特别需求,那么他们就无法继续销售自己的商品。所以,不管是硬件厂商还是软件厂商,还是使用这些提供计算机服务的厂商, 所有与计算机相关的企业,都必须对已经得到满足的顾客们,提供一个购买他们更新技术的“理由”。
从好的方面来看,要想将已经足以满足顾客需要的性能更好地加以利用,就要考虑“如何创造更多的价值”。而实际上,计算机企业所考虑的是向顾客传 达“为了找出创造更多价值的方法,必须进行大量的数据处理”,为了让顾客接受这一提议,必须有一个“明显对商业有价值的理由”。
以现在的计算机技术来看,不管是多么庞大的数据量或者多么繁杂的计算都能够胜任,因此需要考虑的问题就变成了应该针对什么进行计算,而答案除了 统计分析之外再无其他。当然,如果只是将“统计分析”这个简单的词语作为题目,会让人感觉缺乏吸引力,于是就诞生出“大数据”和“商务智能”的概念。现在 大家之所以都对这两个题目和统计学如此关注,恐怕就是出于上述原因。
计算机行业的业界巨人,在弗明汉研究使用穿孔卡片和大型计算机时代就为其提供技术支持的IBM公司在这一点上表现得最为突出。IBM斥资数十亿 美元收购了在商务智能方面非常有名的Cognos公司,以及开发统计分析软件的SPSS公司,这两家公司都是在这一领域拥有丰富经验和影响力的公司。据说 2005~2011年之间,IBM公司对统计学和商务智能相关企业的投资金额已经超过140亿美元。
除了IBM之外,微软公司以及在数据库领域非常有名的甲骨文公司,还有NTT数据公司,都开始积极地收购与统计学和商务智能相关的企业。
或许这几家公司都已经发现,在接下来的时间里从自己的商业领域产生价值的主营产业,都在其中。
最能够证明这一推测的根据,来自于微软在专门用于招聘的网页上于2010年8月23日发表的一篇文章,其中提到技术领域今后最热门的3个专业,如下所示。
数据分析、机械学习、人工智能、自然语言处理。
商务智能、竞争分析。
分析、统计——特别是网页分析、分离测试(A/B测试)、统计分析。
只要是学过“计算机统计学”知识的人,都能够从上述内容里感觉到浓浓的统计学气息吧。
为了再现人类的认知机能,而从计算程序算法研究发展而来的机械学习与人工智能领域,如今若是没有统计学的理论基础就很难深入学习,至于商务智能 则完全可以说是统计学在商业领域的应用。要想完成A/B测试的计划,20世纪中叶现代统计学之父罗纳德·艾尔默·费希尔所完成的被称为“试验设计”的统计 学相关知识,则是最为重要的基础。
未来10年最受欢迎的职业是统计
另外,谷歌(Google)则比微软更加明确地表达了对统计学家的赞誉。谷歌的首席经济学家哈尔·范里安博士曾经在2009年1月麦肯锡公司发行的杂志上这样说道:
我一直坚信,未来10年最受欢迎的职业是统计。
最近,美国人经常使用“sexy”这个词来表达“受欢迎的”或者“有魅力的”,比如,“新款苹果手机的设计非常sexy”。哈尔认为统计学家也是“sexy”的。
作为一名统计学家,我对于哈尔的发言感到非常光荣,而且这绝对不是什么只停留在口头上的赞誉。统计学如今已经得到了计算机这个强有力的伙伴,可以被应用在所有领域,可以出现在世界上的每一个角落,以及人生中的每一个瞬间,能够对所有渴望得到回答的问题给出最佳答案。
曾经人类为了得到(自认为)正确的答案而只能寻求神的启示,后来在漫长时间中只能服从权威人士的意见。
但是,现在的情况不一样了。最佳答案就存在于每个人周围的数据之中。只要掌握统计学这个最强的学问,不管是想要健康、聪明,还是富裕,都变得非常简单。正如之前所说过的那样,这是世界上的学者们通过统计学证明的事实。
而想掌握这个最强、最受欢迎的学问,不必像IBM那样支付数额庞大的资金,只要在你的人生中投入一些学习时间就足够了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02