京公网安备 11010802034615号
			经营许可证编号:京B2-20210330
		数据挖掘技术在采购循环控制中的应用
	在信息化时代,传统的查询、分析功能已不能满足用户对海量信息的管理需求。若不采用新的先进技术,就很难找出数据中隐藏的关系和规律。很难根据目前的状况预测未来的发展趋势。使之为辅助决策提供支持。在这种情况下,数据挖掘技术应运而生。在ERP管理系统中,常用的数据挖掘策略包括分类、估计、预测、无指导聚类、购物篮分析等:常用的数据挖掘技术有统计方法、聚类分析、决策树和决策规则、关联规则、人工神经网络、遗传算法、可视化方法等。在数据挖掘实践中,往往是多种数据挖掘策略和技术方法综合运用。本文以ERP采购管理系统中的成本考核控制模块为例,介绍数据挖掘技术应用的过程。
   一、采购管理系统控制流程
    采购与付款循环是企业资金周转的重要环节,只有及时做好财产物资的供应与验收,才能保证生产和销售的正常运转,因此必须加强对采购循环的控制。
   数据挖掘下的采购循环控制流程如下:申购员根据物料需求计划和仓库储备情况填写请购单,经主管部门领导审批后由采购员寻找供应商,经过比价协商,与供应商审核并签订采购订单。在确定了采购政策之后。材料送到仓管部门验收入库,根据上游单据生成到货单、人库单和采购发票,及时结算并传递给存货核算系统记账、制单,确认商品采购成本。另外,经采购系统结算后的发票传递到资金控制予系统中,由应付会计审核、制单,确保资金合理使用。遵循上述流程,可以将财务实时控制的方法和数据挖掘技术嵌人到ERP采购管理系统中,把存货的实际成本与计划成本比较,确定是超支还是节约。为考核采购员的工作业绩提供量化资料。通过Internet搜集和分析供应商的财务信息和经营状况,制定供应商的新政策,选择物美价廉、性价比高的材料和优质的服务。避免企业财务危机、维护企业信誉。
   二、数据挖掘技术在采购循环控制中的应用
    
分类策略的主要方法之一是决策树方法。根据材料的计划成本和实际成本属性,通过决策树将材料分类,构建材料采购成本风险控制的数据模型,在应用中反复修正,提高采购业绩考核的准确性。然后,对所有材料采购成本进行聚类分析,可以将材料分为若干类,并对不同种类的材料分别采取不同的采购管理政策。例如,对于超支严重的材料进行历次购买行为分析,识别孤立点,当采购行为发生异常时,提示警报,以便深入研究其原因,采取措施。具体过程如下:
    (一)问题陈述。对材料采购成本进行数据挖掘的目的是控制材料采购风险、降低采购成本,以便采取不同的材料供应战略。所以,此次数据挖掘的策略是根据材料采购超支与节约信息对材料进行分类,构建材料采购的分类模型。
    (二)数据收集。要尽可能搜集到所有采购材料的属性值信息,提供海量的数据,将这些数据整合,形成数据集集市,供数据挖掘使用。
    (三)数据预处理。如果将全部数据都拿来做数据挖掘,可能失去控制重点,还可能使错误数据影响数据挖掘,导致无法提练出有用的信息。因此,要经过下列数据预处理过程。(1)依据经验去除明显的异常点。(2)考虑材料采购风险的性质,剔除与数据挖掘主题无关的属性,确定恰当的材料采购描述属性。(3)依据挖掘的需求对数据进行相应的转换。在材料采购成本的数据挖掘中,主要的采购材料属性是供应商名称、仓库名称、材料名称、材料类别、数量、计划单价、实际单价、计划成本、实际成本、超支(节约)差异等等。表1为某企业部分材料采购成本表,已经过数据预处理。先根据材料采购成本的属性对采购业绩考核的重要性,选择材料的实际成本、超支(节约)差异属性作为分类的依据。然后,为了降低材料采购成本的量度影响。对上述两个属性归一化到0和l之间。公式为:归一化值=属性/属性中最大值。
表l
	
 
	(四)模型评估。建立挖掘算法的模型是数据挖掘工作的重要环节。可以使用多种方法分别操作数据集,评估各模型的效果,从而寻找出合适的分析模型。在材料采购成本的数据挖掘中,可以运用分类树方法建立分类决策树,也可以采用聚类分析方法,以材料的实际成本和超支(节约)差异为属性将材料成本分为几类。此分类结果,可用于新增材料成本的分类。实现控制的程序化和自动化。
    
通过SPSS软件的聚类分析工具。使用K均值分类法处理上表的数据。按照设定的分类数目,从随机的初始分区开始,依据样本和类间的相似程度,将样本分配到各类,使之满足相应的收敛准则。过程如下:根据类中心的距离最小原则,把各项目分配到各类中去。产生第1次迭代的K类。根据每类的各项目计算其属性均值,产生第2次迭代的类中心。依次类推,反复迭代,直到达到规定的迭代标准或迭代次数为止。本例K均值分类法选定的类中心数为4,分类属性为归一化材料实际成本和归一化材料超支(节约)差异。经过3次迭代。得到聚类结果,如表2和表3所示。
表2 最终聚类中心
	
 
表3 最终聚类结果
	
 
	(五)解释模型和得出结论。通过对数据挖掘构建的模型进行解释和评价,从大量的、随机的、模糊的、有噪声的实际数据中,提炼出有用的信息和知识,并以用户可理解的语言或可视化的形式呈现给用户。利用数据挖掘获取的信息,分析过去的交易和事项,也为未来的经济业务事项提供决策依据。当出现新交易和事项时,要分析和评价模型的适用性。或适当地修改模型。
    
从最终聚类中心来看,第1类是超支严重,实际成本较高的材料。该类材料应重点关注。可能是采购成本控制不到位,或者是原来制定的计划成本不合理,大大低于市场价。要深入分析原因,采取对策,若是采购人员的工作过失,耍责其改正,严重的要追究责任,使采购成本控制在合理的范围。第2类是超支较严重,实际成本不定的材料,应给予一定的关注,寻找降低采购成本的方法和途径,尽量做到不超支。第3类是既没超支也没节约,实际采购成本相对较为合理的材料。这类材料采购成本控制压力较小,可以减少关注程度。第4类是实际成本小于计划成本。实际成本不定的材料。这类材料采购成本控制工作做得好,应表彰奖励采购人员。总结推广经验。但要注意防止购买价低质次的材料。经过上述聚类分析。将材料采购成本分为4类,分别采取不同的措施。提高了材料采购成本的控制效率。减少了控制的随意性和采购风险。
    上述五个阶段紧密相联,一环扣一环,相互作用,各个阶段都有新的方法和信息注入。
   三、结束语
    将数据挖掘技术用于采购成本控制分析。是挖掘ERP系统应用潜力、控制采购成本和采购风险、提高采购管理水平的有益探索。而且,数据挖掘还可以扩展到采购管理子系统其他方面以及财务管理、销售管理、生产制造、人力资源管理等ERP子系统中。形成一个基于数据挖掘的功能更强大的ERP系统。
                  数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28