
BI 商务智能=数据+分析+决策+利益
一、背景介绍
人类社会从物物交换到货币的产生,到形形色色的交易,产生了我们现在繁荣、复杂的各种商业活动。利益是商务的核心,而商务需要经过买卖双方的交易,谈判,而商品的流通又需要物流、库存,其中业务流程十分繁琐,然而科技进步改善或者正在改变着其形式,人们的工作效率正在极大地提高。
在这个信息化的时代,许多传统业务被信息化手段所取代或者信息化作为其辅助手段。于是乎,在这个时代,所有的人都在谈数据,并且相关的商务数据呈爆炸性指数级的增长。可是,不是所有的数据都是有用的,所以人们需要从中挖掘有用的信息,用以指导现实工作。
商务智能,英文为Business Intelligence,简写为BI。商务智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。比如,百货商场每天有各种各样的商品被出售,其POS系统存储着商品的销售情况,数据量十分庞大。从这些数据,我们利用一定的数学模型和智能软件工具进行分析,知道哪些产品最热销,哪些时段人们喜欢购买什么。接着,运用分析后的结果进行决策,比如分析后得知下雨天的时候啤酒和炸鸡的销量比其他天气时段更多,于是我们决定在下雨的日子增大啤酒和炸鸡的产量。通过这些分析和决策,我们得到了商业利润的增加,这种利润是我们利用现代工具进行商务智能的动力。这个过程可以总结为以下的一个等式:
商务智能=数据+分析+决策+利益
二、数据获取
传统的数据获取是手工进行纸质记录,缺点是记录容易出错,且随着时间的流动,其数量会大大增加以致于查找历史数据的困难。比如,传统地主家的管家进行家庭财政的登记,账本厚又重,对账极其麻烦,而且说不定账本会因为火灾或各种原因而破损,如被老鼠咬烂了。
随着科技的进步,有了计算机,于是数据存到了磁带,然后是磁盘。世界上有了社会分工而美妙,每个人都在自己擅长的领域工作,从而创造着更大的利益。于是乎,不懂计算机的小伙伴借助着别人开发的管理系统进行数据的管理,比如超市的商品管理系统,公司内部的人员管理系统。而软件程序员借助了数据库,数据仓库等产品进行设计编码,创造了上述的管理系统。
于是,一层接力一层,数据的获取从手工一个个用笔记下来到使用计算机键盘进行录入。通过现代科技手段,查看历史数据只要进行搜索,很快很好就能得到十年前的数据,从而可以更大效率地进行数据分析。
商务智能,智能二字凸显了计算机的重要性。计算机的一切都是0,1二进制组成,这两个最普通不过的符号构建了计算机整个数据大厦。如何更好的将数据存到计算机磁盘中,并迅速的读取出来呢?早期的数据存储是使用卡片进行数据读取,后来便产生了现代计算机的存储体系,寄存器,内存,磁盘。从硬件开始,后来出现了软件层面的文件系统,IO流。为了更方便存储大量数据,出现了数据库软件,各种数据库理论和工具开始出现。
目前使用最多的数据库是1993年E.F.Codd提出的关系数据库。
三、数据分析
数据分析方面主要依赖数据挖掘方面的知识,因为商务智能是数据挖掘领域的一个分支。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
数据挖掘利用了来自如下一些领域的思想:(1) 来自统计学的抽样、估计和假设检验,(2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能(并行)计算的技术在处理海量数据集方面常常是重要的。分布式技术也能帮助处理海量数据,并且当数据不能集中到一起处理时更是至关重要。
主要的分析算法有分类 (Classification)估计(Estimation)预测(Prediction)相关性分组或关联规则(Affinity grouping or association rules)聚类(Clustering)等。这些算法主要依赖数学大厦进行构建,大多数商业数据挖掘软件已经实现了这些功能,方便普通人士的使用。
通过使用数据挖掘软件,可以对存储在数据库中的数据进行分析处理,得到一定的统计和计算结果。这些结果可以指导现实的决策。
目前的数据挖掘软件有一般分析目的用的软件包SAS Enterprise Miner,SPSS Clementine,IBM Intelligent Miner等,针对特定功能或产业而研发的软件KD1(针对零售业)Options & Choices(针对保险业)HNC(针对信用卡诈欺或呆帐侦测)Unica Model 1(针对行销业)iEM System (针对流程行业的实时历史数据)。
四、商务决策
随着数据库技术的发展和应用,数据库存储的数据量从20世纪80年代的兆(M)字节及千兆(G)字节过渡到现在的兆兆(T)字节和千兆兆(P)字节,同时,用户的查询需求也越来越复杂,涉及的已不仅是查询或操纵一张关系表中的一条或几条记录,而且要对多张表中千万条记录的数据进行数据分析和信息综合,关系数据库系统已不能全部满足这一要求。在国外,不少软件厂商采取了发展其前端产品来弥补关系数据库管理系统支持的不足,力图统一分散的公共应用逻辑,在短时间内响应非数据处理专业人员的复杂查询要求。
联机分析处理(OLAP)系统是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。.
OLAP工具是针对特定问题的联机数据访问与分析。它通过多维的方式对数据进行分析、查询和报表。维是人们观察数据的特定角度。例如,一个企业在考虑产品的销售情况时,通常从时间、地区和产品的不同角度来深入观察产品的销售情况。这里的时间、地区和产品就是维。而这些维的不同组合和所考察的度量指标构成的多维数组则是OLAP分析的基础,可形式化表示为(维1,维2,……,维n,度量指标),如(地区、时间、产品、销售额)。多维分析是指对以多维形式组织起来的数据采取切片(Slice)、切块(Dice)、钻取(Drill-down和Roll-up)、旋转(Pivot)等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息。
商务决策使用了上述的数据挖掘软件得出的结果,而OLAP是一个更加方便的系统,更快更好的将分析的结果以图表等方式进行展示,方便决策人员进行对比、讨论。通过智能化工具的处理后,领导和改革者可以决定是否开展某项业务,或者如何进行某项业务,这也是称之为商务决策的原因。
五、利益动力
商业智能的关键是从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清理,以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持。
商务智能=数据+分析+决策+利益,等式包含了利益,是因为利益作为一种动力,促进了商务智能的发展。因为想改变,所以改变。因为想提高效率,所以改变。因为要以最小的投入挣得最大的利益,所以要改变。人类生活的改变来源人类对美好生活的追求,想把人类从繁忙的体力劳动中解放出来。计算机这一科技产物,与商务联系起来,必定创造极大的价值。
六、总结
我们可以预示出,在将来的日子,商务智能必将蓬勃发展,一路高歌,这也为我们个人和国家做出了提示。商务智能并不神秘,它就如此简单,总结是:
商务智能=数据+分析+决策+利益
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10