京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据应用:落地才能开花
数据资源,在未来社会将扮演与矿石能源同等重要的角色。如同瓦特的蒸汽机、爱迪生的白炽灯一样,对当下及未来生产、生活模式发生颠覆性影响。而当下如火如荼的大数据核心产业,仍面临诸多挑战,需要经历复杂过程。这不禁让人想起:19世纪初,英国屡次发生工人捣毁生产机器的事件;晚清时期,技术先进的铁路、蒸汽机车被清朝君臣视为“奇技淫巧”,破坏风水。人们接受新生事物,从认知、接受,到使用、建立经营模式,非一朝一夕之功,需从业者谨慎面对,避免概念炒作,创新商业模式,让技术真正“落地“服务。就如同今日的中国机械驰名中外,高速铁路纵横南北,技术“落地”才能生根发芽。
“供给创造它自己的需求”,诞生于19世纪的萨伊定律提出,只要有供给,就会产生相匹配的需求,市场会自动出清。在大数据广泛应用的今天,这一破产于20世纪大萧条时期的理论似乎暗藏新含义。
当前,全球围绕大数据挖掘、采集、存储管理,正在形成一个生态圈,即大数据产业。在消费市场快速变化背景下,依靠大数据分析,市场供应者可精准对接需求,一定程度上,或许真的可以“出清”。
2015年9月,李克强总理签发《促进大数据发展行动纲要》,将大数据产业推向最高热度。2017年政府工作报告中提到,深入推进“互联网+”行动和国家大数据战略。并指出,加快大数据、云计算、物联网应用,以新技术新业态新模式,推动传统产业生产、管理和营销模式变革。2016年,全球大数据核心产业规模达到300亿美元。然而,在迅猛发展过程中,一些现象仍值得思考。
过热炒作的弊端
根据中国信息通信研究院测算:2015年,我国大数据核心产业市场规模达到115.9亿元,增速达38%,预计2016年达到168亿元,2017-2018年还将维持40%左右的高增长。一些大型企业,纷纷建立自己的数据分析团队。阿里巴巴董事局主席马云提出,未来的制造业不仅生产产品,未来的制造业制造出来的机器必须会思考,必须会说话,必须会交流,未来所有的制造业都将会成为互联网和大数据的终端企业。“未来的制造业要的不是石油,它最大的能源是数据”。可是,高增长背后,一些现象透露出隐忧:
2017年初,高德地图公布的大数据分析结果引发争议。其发布的《2016年度中国主要城市交通分析报告》汽车用户画像指出,中高档车主驾驶“野蛮”,其中被看作最野蛮的是mini车主,凯迪拉克车主偏爱洗浴中心。瞬间,一石激起千层浪,不仅相关车主、车友会群起攻之,也引起部分汽车厂商关注。当事方表示,这份分析资料由高德地图交通大数据团队撰写,基于高德积累的海量交通出行数据,通过大数据挖掘计算所得。即便如此,数据来源、计算方法、数据用途都受到质疑。
同样困扰大数据应用的不仅是内容,更有过度的概念炒作、投资过热。2016年,数家大数据技术与应用服务商开始削减团队人数,其中一部分,即便经过多轮融资,但实际经营利润仍无法弥补成本或无法扩大营业规模,出现亏损。伴随而来的是投资削减:据统计,2016年,在大数据领域第三季度共发生投资案例801起,同比减少2.2%。就投资总额看,披露金额的727起投资案例共涉及投资金额1141亿元人民币,同比下降4.9%,较第二季度下降51.1%。投资项目同比降低三分之一。
短短数年时间,大数据分析的商业理念就已经遍布各个行业。而其真正能为产业革新作出的贡献以及产业本身生存状态仍值得商榷。
比计算方法更重要的是制定策略
二战时,英国空军请哥伦比亚大学统计学教授统计战机受损情况,以统计结果作为飞机加强改装的依据。受当时技术局限,飞机只能做部分加强。他们积累了很多数据,统计飞机所有受伤的弹孔位置。最后发现:机翼两端弹孔最多,人们认为应把加强钢板放在机翼,但教授却坚持认为,那些薄弱的部位,就是没有统计出来的地方,因为这些地方受伤的飞机根本没有飞回来。不管是原始的统计方式,还是大数据广泛应用的当下,人们进行统计分析,会忽略很多样本,甚至策略制定发生偏差。如此,再精确的数据统计,也将无济于事。
中国信息通信研究院发布的《大数据白皮书(2016)》指出:我国大数据产业发展已具备一定基础,但要实现从“数据大国”向“数据强国”转变,还面临诸多挑战:一是对数据资源及其价值认识不足。二是技术创新与支撑能力不够。三是数据资源建设和应用水平不高。四是信息安全和数据管理体系尚未建立。五是人才队伍建设亟须加强。在数据资源建设和应用层面。白皮书提出:“用户普遍不重视数据资源的建设,即使有数据意识的机构,大多只重视数据的简单存储,很少针对后续应用需求进行加工整理。数据资源普遍存在质量差,标准规范缺乏,管理能力弱等现象,跨部门、跨行业的数据共享仍不顺畅,有价值的公共信息资源和商业数据开放程度低。数据价值难以被有效挖掘利用,大数据应用整体上处于起步阶段,潜力远未释放。”
在金融应用领域,91金融CEO许泽玮认为,不能过分依赖数据,要设立风险委员会,使专业人员的经验与数据统计相结合。同时,企业一定要具有足够的数据处理能力,同时要确保安全。“在检测防控风险方面,需采用线上和线下相结合的风险管理体系,包括基于大数据的线上征信和风控模型,以及传统的线下调查和贷后管理。”许泽玮介绍,建立具备丰富风控经验的从业团队,基于线上的大数据匹配,严格筛选借款人,确保他们有稳定的企业和还款能力,此外,借款人借款金额必须在抵押物评估值的70%以内,而且借款期限不得超过6个月。5位风控委员会委员均投票通过,则可以借出,如有一人不同意,则此项目作废。在很多行业愈发依赖大数据的当下,这些人工程序和经验愈发重要。
现在,公众对“大数据”已有基本认知,各种大数据的案例故事广为流传。但在当下,概念性的故事,未必能带来真正效果。人们需要的是,把停留在“讲故事”层面的内容深挖、落地,变成真正可行,低成本高效率的商业模式,让当下的概念在应用场景中发挥真正价值。
用数据解决实际问题
解决大数据应用的痛点,要解决使用者的大数据认知,更要实现大数据应用“落地服务”。
多数企业需要的不是数据本身,而是用数据解决实际问题。不是每个企业经营者都需要具备数据分析系统,但他们都希望大数据带来收益并节约成本。能够给企业带来价值的大数据“落地服务”,才有可能被企业接受。避免炒作、制定策略、落地服务是决定大数据核心产业长足发展的关键。
就金融行业而言,大数据主要业务应用于企业风险管理、信用评估、借贷、保险、理财、证券分析等。在这些领域,可以通过获取、关联和分析更多维度、更深层次的数据,通过不断发展的大数据处理技术得以更好、更快、更准确的实现,更多的金融企业利用大数据技术整合来自互联网等渠道的外部数据,从而使得原来不可担保的信贷可以担保,不可保险的风险可以保险。 《大数据白皮书(2016)》披露:中信银行信用卡中心从2010年开始引入大数据分析解决方案,为企业中心提供了统一的客户视图。借助客户统一视图,可以从交易、服务、风险、权益等多层面获取和分析数据,对客户按照低、中、高价值来进行分类,根据银行整体经营策略积极地提供相应的个性化服务,在降低成本的同时大幅提升精准营销能力。
许泽玮介绍,他们通过自主研发搜索引擎,捕捉借款用户的网络行为轨迹,鼓励借款用户将账号与微博等社交网络账号关联,监测用户登录习惯,不断积累和健全用户行为因子,扩展并完善大数据风控模型。他说,完善的用户数据主要有两大作用,一方面是为了更好地防范金融风险,另一方面则是为了进一步完善用户画像,实现精细化运营。让数据真正服务于业务。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27