
插上“大数据”翅膀 “捕鼠”从此大不同
“社会上多余的资金很多,为什么不愿意进入股市?就是因为他在信息上抢不过别人,光看K线没有用,不管是大老鼠,小老鼠,也许是看起来比较可爱的米老鼠,都是很可怕的。”这是一位资深股民吐露的心声。
而在大数据时代,监管者的“捕鼠”工具全面升级,这犹如阿基米德找到了撬动地球的支点,整个资管行业已然一片风声鹤唳。
监管者利用大数据系统“捕鼠”最早体现在2013年的马乐事件上。此后开始的老鼠仓调查风暴,很多线索来源都是来自于交易所日常监控下的大数据分析。“捕鼠”行动插上“大数据”翅膀,效果的确立竿见影。
此前的老鼠仓查处案件,线索来源多来自于举报与现场突击检查等,或是从其他案件顺延发现线索。交易所数据应用流程通常是先发现个股触动异动指标,随之核查该公司是否有特殊信息公布以及与之相关的可疑账户锁定。这种迹象即成为线索,按一定程序报送至证监会,证监会决定是否立案。
据记者了解,多年之前,证监会基金部建立了一套监测基金公司非公平交易的系统,可实时掌握基金公司不同基金产品间利益输送行为。这套系统后来与沪深交易所的异常交易系统相结合,逐步发展出完善的市场异动监测工具。
目前,交易所的大数据系统大致可以分为交易数据和文本数据两块。文本数据系从美国学习引进的技术;而交易数据的挖掘,事实上是一个很成熟的学科,但应用到股票交易的监管上,仍然需要一线监管和稽查执法的经验总结。
在业内看来,区分高度相似的交易到底是巧合还是老鼠仓,需要进行大量的历史分析。一个月的数据远远不够,至少需要一年,甚至三到五年。在这样一个长的时间跨度内,如果大量的交易行为与老鼠仓的特征吻合,则作为证据的证明能力更强。
具体来看,上交所异动指标分为4大类72项,敏感信息分为3级共11大类154项;深交所建立了9大报警指标体系,合计204个具体项目。此外,深交所监察系统即可同步实现超过204个报警指标、300项实时与历史统计查询、60余项专用调查分析、100多种监管报表监测分析等功能,每年处理的各类实时报警信息14万余次,平均每个交易日处理报警600余次。
“过去查老鼠仓还会到公司来查封电脑,现在得益于大数据系统的应用,稽查部门在老鼠仓案件中收集掌握的证据更加有效,在侦查阶段基本上不打草惊蛇,不用直接接触被调查对象和相关公司,证据确凿后,公安局直接就把人带走了。”一位基金从业者说。
更令人欣喜的是,大数据的应用或将进入一个更新的高度。据记者了解,不久前证监会主席办公会刚批准通过的证监会中央监管信息平台,可以将目前分散在证券监管领域各个角落的信息集合起来,即包括交易所数据库,也包括各层级证券监管部门的日常监管、检测数据信息。
“这将是一个智能化、云数据的平台,未来会对提高稽查执法效率等起到很大作用。”接近监管层的相关人士表示,此外,监管层也在进一步加强稽查执法力量。比如眼下已在上海和深圳增编稽查支队,每个支队增加了近100人。从技术到人力资源配置,未来的稽查风暴将成为常态化。
在“捕鼠”行为更为智能、更为常态化的形势下,不少业内人士都感觉“压力山大”。目前,借助大数据系统,“捕鼠”风暴已从基金圈刮向了券商。有券商短短数周内接连召集分析师突击开会强调风险。不少分析师坦言,这一轮风暴的紧张程度之高已经超过了其职业生涯的其他时刻。
“近一个月,我们已经专门就做好风险规避工作开了四五次会。”有券商分析人士透露,公司异地设立的研究所听说也召开了内部会议,主要内容依然是严格要求按风控规程操作,研究报告不允许违规传播,不管是邮件、QQ还是微信都要谨慎提及个股,严禁传播内幕信息。
多位券商人士表示,“眼下这场已经延续了数月的风暴已经不再仅仅盯着基金经理,而已横扫资本市场各个利益环节,券商、保险、私募都难逃一查。”
5月9日,证监会通报了平安资产管理公司一位投资管理人员涉嫌老鼠仓。北京市公安局于5月13日通报了另一起保险公司权益投资部门总经理的老鼠仓案件,且已正式批捕。这两起案件的共同特点是涉案累计金额巨大,均在亿元以上。
从证监会最新信号来看,此次“捕鼠”行动绝不是“一轮运动”。5月19日,证监会主席肖钢在学习落实“新国九条”的讲话中表示将坚决打击证券期货违法犯罪行为。加强对证券期货违法违规行为的监测和线索发现,将坚决打击欺诈上市、虚假信息披露、内幕交易、操纵市场等各种违法违规行为,并特别强调会“始终保持高压态势”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30