京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据审计:让违规资金无处遁形
随着信息技术的迅猛发展,行业应用所产生的数据呈爆炸性增长,大数据审计应时而生。去年以来,审计厅尝试运用大数据分析技术,探索审计监督新模式,撞开了一扇新的高效的“审计之门”。
“审计对数据有天然的依存关系。”5月27日,审计厅厅长黄河说,作为经济运行综合性监督部门,保持对社会经济数据的灵敏感触,深挖细掘、充分运用,是大数据时代对审计工作的内在要求和必然选择。
大数据审计到底有多神奇?审计人员如何从海量数据中发现违规资金的疑点和线索?记者追踪了一年来审计在大数据环境下的足迹。
审计数据量有多大?
一次审计调用700G数据
今年2月,审计厅电子数据审计处正式挂牌成立,负责组织开展跨行业、跨部门、跨地区的数据分析,联网审计和省直各部门(单位)电子信息系统审计,以及对电子数据进行综合分析和利用等工作。而我省大数据审计的尝试,此前早已开始。
去年初,审计厅建立起分类分步采集的数据获取机制。通过专网联结、定期拷贝与建立定期报送制相结合的方式,审计部门可以无障碍获取不同系统不同部门的电子数据信息。目前,审计数据中心已收集有省级财政国库集中支付业务、非税收入、总预算会计数据等相关数据。
以海量数据为基础,依托不同的审计分析模型,审计人员就可以有针对性地“攫取所需”了。
正在进行的税收征管审计中,审计厅专门成立的地税审计数据分析团队充分利用采集到的各类数据,构建起125个审计分析模型,覆盖了包括税务管理、税款征收、发票管理等几乎所有地税业务。分析团队查询分析了多个系统约700G的电子信息数据,在房产税、车船税、城镇土地使用税、机打发票、三代管理、小微企业税收优惠政策执行、退税等7方面新编写了21个审计方法。然后,审计人员选取国土、工商、房地产等外部涉税信息数据,与相关税收征管数据比对分析,揭示出漏征漏管税收和征管制度缺陷等各种问题,提出了有针对性的审计建议和意见。
审计速度有多快?
几周的工作量缩短到几分钟完成
有了大数据分析技术支持,一些大型专项审计能够在短期内完成。
全省农村信用社数量多、分布广、业务量大,有着庞大的数据量。过去,由于缺乏计算机及金融专业人才,加上各市州审计机关各自为政,存在许多重复劳动和结果不显著的问题。正在进行的针对全省农村信用社112家法人机构的审计改变了这一尴尬状况。
审计部门依托创新开发的金融审计数据分析平台,实施“总体分析、发现疑点、分散核实、系统研究”新型审计模式,提升了审计项目实施的实时互动、科学管理以及数据利用。“通过编制审计模型,数据分析小组可在那些令人眼花缭乱的数据、票证中,循着蛛丝马迹,快速找到同一违法行为的共同标志,让异常数据浮出水面。”数据分析组组长介绍说,以贷款为例,数据分析人员可通过数据联网分析贷款户的资金流向是否符合国家政策和申贷要求,跟踪资金用途,就能查出有没有被挪用,是否存在非法侵占、挥霍贷款等情况。
这项审计涉及贷款总量超过1000亿元,审计厅在短短一周内便实现了对全省信用社信贷发放结构等业务数据的分析和核实。按照传统审计办法,审计骨干人员可能要几周才能完成的工作量,如今几分钟就能完成。
数据挖掘有多深?
一家公司异常带出一个行业整治
大数据审计依托信息数据进行系统分析,实现了精准核查、整体评价。
去年上半年进行的预算执行审计中,审计人员利用不同行业数据之间存在的关联关系进行比对,发现省级劳务公司开票金额与营业税计税基数之间出现巨大异常。随后顺藤摸瓜,又发现有数十户劳务派遣公司开具发票18万张、涉及金额144亿元,而计税基数仅为发票额的1%-2%。针对审计发现的问题,省地税局、公安厅、审计厅等部门专题研究部署,迅速启动了对全省劳务公司开具发票的专项整治工作。
对于这次审计,电子数据审计处处长余川感触最深:“大数据分析立足于与审计对象具有关联关系的所有数据,为审计提供了一种站高望远、从整体把握对象的技术手段。”
有了大数据分析的支持,审计人员犹如多了一双透视眼,可以快速锁定疑点,并追询疑点、定向排查、查实查透。
4月刚结束的全省保障性安居工程跟踪审计中,审计组通过比对部分市、县10余万条人员信息数据与房管部门商品房信息,发现了上千名购有商品房、超过规定标准的人员违规享受保障性住房;通过将享受保障性住房待遇人员信息与同期养老保险缴费基数、公积金缴费基数、个人所得税应税数及机动车辆登记信息等进行比对,骗取或违规享受保障性住房、骗取或违规领取货币补贴等问题浮出水面。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04