京公网安备 11010802034615号
经营许可证编号:京B2-20210330
北京用大数据打击非法集资揭秘_数据分析师考试
自今年5月北京“打击非法集资监测预警平台”上线以来,已关注到400多家机构有非法集资嫌疑,目前已向公安报送35起涉嫌非法集资的线索,其中包括20家P2P机构、5家PE机构、10家第三方理财机构
借助互联网技术的发展,互联网金融异军突起,鱼龙混杂之下,借金融创新之名行非法集资之实的企业也多了起来。
一场轰轰烈烈的打击非法集资行动正在开展中。根据国务院要求和市委市政府工作部署,从2015年4月到8月,北京市将开展打击非法集资专项整治行动。
记者在采访中了解到,与以往不同的是,此次北京市运用了已经建成的“打击非法集资监测预警平台”,通过大数据采集、分析技术,全天候无缝隙地对非法集资活动进行监测预警。大数据已经由企业商用扩展至服务于政府的执法工作。
6月2日,北京市金融工作局副巡视员沈鸿在接受法治周末记者采访时表示,自今年5月该大数据监测平台上线以来,已经关注到400多家机构存有非法集资嫌疑,目前北京市金融局已向公安部门报送了35起涉嫌非法集资的线索,其中包括20家P2P机构、5家PE机构、10家第三方理财机构。
传统打非手段存局限
据北京市打非办披露,目前北京市非法集资案件高发频发,呈现出案件规模快速上升,人均涉案金额明显增加,大案要案多发的特点。仅2014年北京就新发非法集资案件89件,集资人2.1万人,涉案金额172.6亿元。同比增长了2.56倍、5.65倍、56.9倍。
在上述案件中,P2P网贷类、投资理财类、私募股权投资类等案件呈爆发态势。公开信息显示,截至今年1月,北京已经出现了18家P2P网贷问题平台,包括跑路、诈骗、经营困难等现象。其中共立案网金宝、里外贷等4家P2P类非法集资案件,总计涉案金额约17亿元,涉及投资人4230人。
中央财经大学法学院互联网金融与民间融资法治研究中心执行主任郭华在接受法治周末记者采访时表示,过去打击非法集资主要依靠参与者的报案、投诉,甚至是上访,公安部门才能掌握这些线索。
这样打击非法集资的方式容易带来一个问题:公安部门介入的时机难以把握。“非法集资很多时候是一个由合法逐渐转为非法的过程,介入过早,一部分获得利益的投资者会对打击非法集资的部门不满;介入过晚,往往财产难以追回,投资者的权益很难得到保障,投资者也会有不满。”郭华说。
如何尽可能地早些发现非法集资风险,并向监管部门作出预警,提前介入,尽可能地保障投资者的权益,尤其是将一些打着互联网金融旗号的伪P2P机构、伪私募机构识别出来,做到提前监测和预警,就显得至关重要,而在这方面,大数据有很大的发展空间。
大数据打非登场
沈鸿对法治周末记者表示,过去非法集资更多是通过线下开展讲座、发传单、发展会员的方式进行,但随着互联网技术发展,非法集资的宣传和组织也开始往线上迁移。
正是由于非法集资在互联网上留下了越来越多的痕迹和数据,沈鸿介绍,从2013年起,北京市金融局就尝试通过大数据监测的方式将打击非法集资的工作端口前移。经过两年多的研究,今年5月“打击非法集资监测预警平台”正式上线。
据法治周末记者了解,目前提供该平台数据服务的为北京金信网银金融信息服务有限公司(以下简称“金信网银”)。
金信网银常务副总经理李崇纲告诉法治周末记者,如果简单套用最高院司法解释中对非法集资认定的“四要件”去套如今的互联网金融,尤其是P2P行业,那么很多P2P平台都有可能涉嫌非法集资,但这样的界定和监管其实也不是监管机构所期望的。
“通过对已经跑路的200余家P2P机构进行分析,我们发现它们存在的风险特征有欺诈风险、市场风险、操作风险、信用风险等,而且在发展不同阶段呈现出不同的特征值,我们据此构建了风险评估模型,然后将现有的平台数据与该模型进行比对,可以有效地发现预警非法集资活动。”李崇纲说。
李崇纲向记者介绍了该预警平台的工作原理:首先,从财经网(博客,微博)站、P2P网站、贴吧、工商税务网站、社交媒体、法院、12345(市非紧急救助服务热线)等数据源大规模的采集原始数据,并根据行业、区域、产品对数据自动分类,标引并存储在金融风险分析大数据平台中。
其次,对多个数据源的数据,在内存式计算平台上进行分布式计算,经过数据清洗、数据集成、数据变换、数据规约等一系列预处理过程,把数据集合统一转换成可供分析的结构化数据。最后,通过分析算法,依照此前建立的多个风险预测模式,计算出不同的风险指数,再通过整合,可最终得出非法集资风险指数。
就P2P网贷平台而言,李崇纲介绍,主要从平台特征(公司信息、关联企业、团队构成)、项目特征(项目特征、收益情况、项目期限)、安全特征(技术保障、担保保障、法律保障等)三个方面采集信息。
在对上述数据处理后,会抽象出五个特征:合规性指数、特征词命中指数、传播力指数、收益率偏离指数以及投诉率指数,分别对应非法集资的非法性、社会性、公开性、利诱性。
通过对这些指数进行加权平均,就可以得出一个非法集资风险指数,也称“冒烟指数”。李崇纲介绍,如果指数为60—80区间,则意味着其非法集资的风险非常高,需要公安部门介入;指数为40—60区间,则需要监管部门密切关注。
为了确保模型的准确性,金信网银还借助公安部门和北京市金融局实际办案的反馈情况,对数据模型进行回测,以进一步优化模型。
李崇纲告诉法治周末记者,今年以来,公司根据大数据的监测情况向相关部门报送了30余起涉嫌非法集资的情报线索,其中有几起已经进入侦查阶段。
中关村(000931,股吧)大数据产业联盟副秘书长陈新河告诉法治周末记者,目前大数据已经越来越广泛地运用于政府机构的监管和社会管理上,此前证监会就通过利用大数据监察系统打击“老鼠仓”和内幕交易,取得良好的效果。
“利用大数据技术从海量数据中快速锁定目标,也有助于降低监管成本,提升监管效率。”陈新河说。
大数据现非集蛛丝马迹
尽管从事非法集资的行为越来越隐蔽,但是通过对跑路平台行为特征进行研究,还是可以从中发现一些规律,或者是涉嫌非法集资平台的共性来。
李崇纲介绍,目前互联网金融行业发展迅猛,却又鱼龙混杂。一些平台为了博取投资人的信任,特别偏爱“傍大款”,对于这样的平台要提高警惕—2014年6月跑路的“网金宝”平台,就曾在官网宣称同中国人民银行正式签署了战略合作。
此外,一些存有非法集资风险的平台多通过举办一些收益率颇高的优惠活动招揽投资者。还以网金宝为例,李崇纲介绍,去年5月26日,其发起了一个名为“天降财牛”的活动,只要投资1万元就能获得不同数额的返现,而且返现可以当日提取,过于丰厚的回报使得投资者争相涌入。
据媒体报道,贵州一位投资者在成功尝试一次后,索性将自己辛苦攒下的16万元存款全部投放了进去。同时还发动身边亲友,累计共投资了45万元。不过,活动持续了不到十天,投资者就发现其网站已经无法打开,客服热线无法接通。宣称的办公地址也不存在。
此外,通过对此前跑路平台特征进行梳理,李崇纲发现,不少平台的工商登记信息变动颇为频繁。一些非法集资风险高的平台或者机构,往往会在短时间内频繁变更公司股东和法定代表人。
“根据监测,曾经有一家平台在一个月的时间内曾连续5次变更股东或者其他工商注册信息,而且一些平台的每个股东名下可能有十余家公司,这些公司之间又存在纵横交错的复杂关联关系。如果是一家正常运作的公司,是很少出现这种情况的。”李崇纲说。
根据研究和分析,李崇纲还发现,一些蓄意跑路或存在非常大的非法集资风险的平台,都非常善于抓政策法律的空子。
以注册资本登记制度改革为例,2014年2月7日,国务院下发了《注册资本登记制度改革方案》,根据要求,从2014年3月1日起,公司实收资本、股东认缴、实缴出资额、出资方式、出资期限不再作为登记事项,企业办理设立及变更时,由公司自行在市场主体信用公示系统上公示注册资本实缴情况。
李崇纲告诉记者,根据大数据平台的监测,一些P2P平台紧抓这一时机,变更自己的注册金额数量,“有的平台原先注册资金只有区区几十万元,瞬间就变更到了几千万元,甚至上亿元”。
“很多投资者,其实是很难知道平台是否真的有这么雄厚的资金实力,但这样的显示结果的确会增加平台的信誉。”李崇纲表示,根据监测,很多出现问题的平台大都利用该制度变革契机,来提升公司注册资本。
有鉴于此,在该大数据预警体系中,短期内提供过高的收益率、频繁变动公司股东、在特定时间段提高公司注册资本金额都会予以特别关注。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04