京公网安备 11010802034615号
经营许可证编号:京B2-20210330
好久没写文章了,本人目前从事BI行业,主要做BO(报表展示)这一块,写这一篇文章主要是想分享一下自己的心得。本人不是大牛,基础小白,所以下面你会看到的更多是不经润色(不经大脑)的心得体会,而不是一堆NB轰轰的专业名称,算法,建模思想,分析思路等技术分享型文章。更多的是对这个职业的看法,技术上的问题相信度娘比我更加专业!
欢迎吐槽指正!
说到数据分析一定要讲BI
商业智能(BI,BusinessIntelligence)。
BI(BusinessIntelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策。
广义的BI是包括很多方面的内容,包括数据处理—》数据存储—》数据仓库—》(数据挖掘)—》BO展示层
BI是智能化的数据分析,说白了就是很多手工的工作我们让电脑帮我们做了,省去大量复杂繁琐的人工,这就是智能。比如日报,周报,月报这些报表我们统一用工具定时自己跑出来!
要说的有3点:
1、目前大部分企业的BI是不包括数据挖掘的,实际上很多人也不是很清楚这个流程,一般只是认为BI就是做报表的。恩,对,就是做报表的(BO展示层)。
2、一般小企业的数据分析岗位,很多只是简单粗暴的DB+Excel,所以你会发现,**,工资好低!
3、DB+Excel是基于小企业数据分析量不大才能这么做的,未来数据暴增下,一个注重数据分析的企业势必会走势智能化这条路,毕竟人工也是成本啊~
数据分析与数据挖掘
/**以下是百度百科解释**/
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
数据挖掘(英语:Datamining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
数据分析和数据挖掘很多人没有分清,数据分析其实也是包括数据挖掘的,不过现在大部分企业细分岗位,一般数据分析和数据挖掘是两个不同的岗位!
以下我所讲的数据分析都是基于目前企业数据分析岗位而言(狭义上的数据分析,做报表的~)
数据分析主要是描述性统计分析,出报表,属于BO层面。工具有IBMcognos、SAPBO、oracleBIEE、MicrosoftSSRS、MicroStrategy、Smartbi、QlikView、Power-BI等~太多了,基本功能都相似,就是做好OLAP数据集后通过可视化的操作开发出报表框架,再定时出报表!
数据挖掘主要用于海量数据挖掘、预测性分析,比如关联规则,分类、回归、聚类、离群点检测之类的算法,主要工具有SAS、SPSS、R&Python、MSDataMing等,SAS&SPSS可视化界面,操作简单,比较容易上手;R&Python需要自己编程,难度比较大,但是函数、算法都封装好了,可以直接拿来用。
数据挖掘主要是基于海量的数据,即大数据。现在感觉任何东西跟大数据挂钩,它就变得高大上了!基于这个数据量的前提,所以目前国内做数据挖掘的主要在金融(银行、保险、证券)、电信、广告等行业&BAT三大巨头!
说实在数据挖掘,算法,统计思想这些不是最重要的,最根本是业务知识!跟BO对比起来,数据挖掘更最要你对业务的理解,如果你对业务理解透彻了,很多东西甚至都不需要经算法建模,只需要画一个透视图、透视表你就会发现其中的规律(知识)了。
很多新手都会问到的一个问题是,入门需要什么技能?
一、对于数据分析而言,最重要的技能是SQL、SQL、SQL+BO工具(这个有些了解就可,毕竟使用简单)
SQL需要会到什么程度?企业日常用到的大部分是:80%(增删查改+连接查询+基本聚合函数+数据格式处理函数)+20%(其他函数使用),而你只要需要会增删查改+连接查询+基本聚合函数+数据格式处理函数这些基础功能即可,其他函数使用通过百度你能看懂能用就行,使用率比较低。
二、对于(DM)数据挖掘而言,建模大部分的工作还是花在了数据处理上,这个要看对应企业使用的工具,数据处理流程要懂!!+算法(建模)思想+统计学基础,业务知识都是在日常工作中积累的。SO,DM的入门基础就相对要高些,门槛也相对较高。
三、补充一点:对于数据分析和数据挖掘以及大数据相关的工作还有一个特别重要的岗位,就是数据库开发。不同于DBA,大部分BI&DM80%数据库开发的工作其实都是在倒腾数据,所以前期数据处理环节特别重要,衍生出专业的数据库开发,主要做ETL、数据迁移,建多维数据集、数据仓库,OLAP,universe,query之类的工作。对技术要求较高,属于底层工作人员,个人觉得特别重要!
技术控的可以往数据库开发或数据挖掘走,数据分析(BO)技术要求比较低。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23