京公网安备 11010802034615号
经营许可证编号:京B2-20210330
揭秘:北京用大数据打击非法集资
自今年5月北京“打击非法集资监测预警平台”上线以来,已关注到400多家机构有非法集资嫌疑,目前已向公安报送35起涉嫌非法集资的线索,其中包括20家P2P机构、5家PE机构、10家第三方理财机构。
借助互联网技术的发展,互联网金融异军突起,鱼龙混杂之下,借金融创新之名行非法集资之实的企业也多了起来。
一场轰轰烈烈的打击非法集资行动正在开展中。根据国务院要求和市委市政府工作部署,从2015年4月到8月,北京市将开展打击非法集资专项整治行动。
记者在采访中了解到,与以往不同的是,此次北京市运用了已经建成的“打击非法集资监测预警平台”,通过大数据采集、分析技术,全天候无缝隙地对非法集资活动进行监测预警。大数据已经由企业商用扩展至服务于政府的执法工作。
6月2日,北京市金融工作局副巡视员沈鸿在接受法治周末记者采访时表示,自今年5月该大数据监测平台上线以来,已经关注到400多家机构存有非法集资嫌疑,目前北京市金融局已向公安部门报送了35起涉嫌非法集资的线索,其中包括20家P2P机构、5家PE机构、10家第三方理财机构。
传统打非手段存局限
据北京市打非办披露,目前北京市非法集资案件高发频发,呈现出案件规模快速上升,人均涉案金额明显增加,大案要案多发的特点。仅2014年北京就新发非法集资案件89件,集资人2.1万人,涉案金额172.6亿元。同比增长了2.56倍、5.65倍、56.9倍。
在上述案件中,P2P网贷类、投资理财类、私募股权投资类等案件呈爆发态势。公开信息显示,截至今年1月,北京已经出现了18家P2P网贷问题平台,包括跑路、诈骗、经营困难等现象。其中共立案网金宝、里外贷等4家P2P类非法集资案件,总计涉案金额约17亿元,涉及投资人4230人。
中央财经大学法学院互联网金融与民间融资法治研究中心执行主任郭华在接受法治周末记者采访时表示,过去打击非法集资主要依靠参与者的报案、投诉,甚至是上访,公安部门才能掌握这些线索。
这样打击非法集资的方式容易带来一个问题:公安部门介入的时机难以把握。“非法集资很多时候是一个由合法逐渐转为非法的过程,介入过早,一部分获得利益的投资者会对打击非法集资的部门不满;介入过晚,往往财产难以追回,投资者的权益很难得到保障,投资者也会有不满。”郭华说。
如何尽可能地早些发现非法集资风险,并向监管部门作出预警,提前介入,尽可能地保障投资者的权益,尤其是将一些打着互联网金融旗号的伪P2P机构、伪私募机构识别出来,做到提前监测和预警,就显得至关重要,而在这方面,大数据有很大的发展空间。
大数据打非登场
沈鸿对法治周末记者表示,过去非法集资更多是通过线下开展讲座、发传单、发展会员的方式进行,但随着互联网技术发展,非法集资的宣传和组织也开始往线上迁移。
正是由于非法集资在互联网上留下了越来越多的痕迹和数据,沈鸿介绍,从2013年起,北京市金融局就尝试通过大数据监测的方式将打击非法集资的工作端口前移。经过两年多的研究,今年5月“打击非法集资监测预警平台”正式上线。
据法治周末记者了解,目前提供该平台数据服务的为北京金信网银金融信息服务有限公司(以下简称“金信网银”)。
金信网银常务副总经理李崇纲告诉法治周末记者,如果简单套用最高院司法解释中对非法集资认定的“四要件”去套如今的互联网金融,尤其是P2P行业,那么很多P2P平台都有可能涉嫌非法集资,但这样的界定和监管其实也不是监管机构所期望的。
“通过对已经跑路的200余家P2P机构进行分析,我们发现它们存在的风险特征有欺诈风险、市场风险、操作风险、信用风险等,而且在发展不同阶段呈现出不同的特征值,我们据此构建了风险评估模型,然后将现有的平台数据与该模型进行比对,可以有效地发现预警非法集资活动。”李崇纲说。
李崇纲向记者介绍了该预警平台的工作原理:首先,从财经网站、P2P网站、贴吧、工商税务网站、社交媒体、法院、12345(市非紧急救助服务热线)等数据源大规模的采集原始数据,并根据行业、区域、产品对数据自动分类,标引并存储在金融风险分析大数据平台中。
其次,对多个数据源的数据,在内存式计算平台上进行分布式计算,经过数据清洗、数据集成、数据变换、数据规约等一系列预处理过程,把数据集合统一转换成可供分析的结构化数据。最后,通过分析算法,依照此前建立的多个风险预测模式,计算出不同的风险指数,再通过整合,可最终得出非法集资风险指数。
就P2P网贷平台而言,李崇纲介绍,主要从平台特征(公司信息、关联企业、团队构成)、项目特征(项目特征、收益情况、项目期限)、安全特征(技术保障、担保保障、法律保障等)三个方面采集信息。
在对上述数据处理后,会抽象出五个特征:合规性指数、特征词命中指数、传播力指数、收益率偏离指数以及投诉率指数,分别对应非法集资的非法性、社会性、公开性、利诱性。
通过对这些指数进行加权平均,就可以得出一个非法集资风险指数,也称“冒烟指数”。李崇纲介绍,如果指数为60—80区间,则意味着其非法集资的风险非常高,需要公安部门介入;指数为40—60区间,则需要监管部门密切关注。
为了确保模型的准确性,金信网银还借助公安部门和北京市金融局实际办案的反馈情况,对数据模型进行回测,以进一步优化模型。
李崇纲告诉法治周末记者,今年以来,公司根据大数据的监测情况向相关部门报送了30余起涉嫌非法集资的情报线索,其中有几起已经进入侦查阶段。
中关村大数据产业联盟副秘书长陈新河告诉法治周末记者,目前大数据已经越来越广泛地运用于政府机构的监管和社会管理上,此前证监会就通过利用大数据监察系统打击“老鼠仓”和内幕交易,取得良好的效果。
“利用大数据技术从海量数据中快速锁定目标,也有助于降低监管成本,提升监管效率。”陈新河说。
大数据现非集蛛丝马迹
尽管从事非法集资的行为越来越隐蔽,但是通过对跑路平台行为特征进行研究,还是可以从中发现一些规律,或者是涉嫌非法集资平台的共性来。
李崇纲介绍,目前互联网金融行业发展迅猛,却又鱼龙混杂。一些平台为了博取投资人的信任,特别偏爱“傍大款”,对于这样的平台要提高警惕—2014年6月跑路的“网金宝”平台,就曾在官网宣称同中国人民银行正式签署了战略合作。
此外,一些存有非法集资风险的平台多通过举办一些收益率颇高的优惠活动招揽投资者。还以网金宝为例,李崇纲介绍,去年5月26日,其发起了一个名为“天降财牛”的活动,只要投资1万元就能获得不同数额的返现,而且返现可以当日提取,过于丰厚的回报使得投资者争相涌入。
据媒体报道,贵州一位投资者在成功尝试一次后,索性将自己辛苦攒下的16万元存款全部投放了进去。同时还发动身边亲友,累计共投资了45万元。不过,活动持续了不到十天,投资者就发现其网站已经无法打开,客服热线无法接通。宣称的办公地址也不存在。
此外,通过对此前跑路平台特征进行梳理,李崇纲发现,不少平台的工商登记信息变动颇为频繁。一些非法集资风险高的平台或者机构,往往会在短时间内频繁变更公司股东和法定代表人。
“根据监测,曾经有一家平台在一个月的时间内曾连续5次变更股东或者其他工商注册信息,而且一些平台的每个股东名下可能有十余家公司,这些公司之间又存在纵横交错的复杂关联关系。如果是一家正常运作的公司,是很少出现这种情况的。”李崇纲说。
根据研究和分析,李崇纲还发现,一些蓄意跑路或存在非常大的非法集资风险的平台,都非常善于抓政策法律的空子。
以注册资本登记制度改革为例,2014年2月7日,国务院下发了《注册资本登记制度改革方案》,根据要求,从2014年3月1日起,公司实收资本、股东认缴、实缴出资额、出资方式、出资期限不再作为登记事项,企业办理设立及变更时,由公司自行在市场主体信用公示系统上公示注册资本实缴情况。
李崇纲告诉记者,根据大数据平台的监测,一些P2P平台紧抓这一时机,变更自己的注册金额数量,“有的平台原先注册资金只有区区几十万元,瞬间就变更到了几千万元,甚至上亿元”。
“很多投资者,其实是很难知道平台是否真的有这么雄厚的资金实力,但这样的显示结果的确会增加平台的信誉。”李崇纲表示,根据监测,很多出现问题的平台大都利用该制度变革契机,来提升公司注册资本。
有鉴于此,在该大数据预警体系中,短期内提供过高的收益率、频繁变动公司股东、在特定时间段提高公司注册资本金额都会予以特别关注。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27