京公网安备 11010802034615号
经营许可证编号:京B2-20210330
17年数据分析经验告诉你大数据行业的门道
本文根据具有十七年数据分析行业经验的嘉宾陈晨的纪实采访整理。
本期专访嘉宾:陈晨
简历:现任电通安吉斯 – 美库尔(DAN – Merkle) 中国(上海/南京) 数据与分析部高级总监,兼任Merkle南京公司总负责人。十七年以上美国、加拿大及中国咨询业及行业领先公司数据营销、风险分析、定量模型,客户关系管理策略的经验,拥有市场营销、定量方法 、经济计量和统计学方面坚实基础,和建立银行/金融/零售业营销模型和信用评分模型的丰富项目背景。
Q:如果企业想要挖掘数据价值,但由于种种原因,导致数据本身维度不完备,或缺失较多等情况。您能利用多年项目经验,跟我们分享一下这类企业应该怎样有效利用数据吗?
陈晨:对于广告营销而言,有用的数据维度是越多越好。即使企业自身CRM做得非常完备,有了其他数据源的补充,对于理解现有客户群体,如何进行下一步营销活动的准备都是非常有好处的。
事实上,没有任何一家数据提供商能够满足品牌所有的营销信息需求,品牌需要的是因地制宜地购买、结合与其最相关的高质量数据内容。Merkle可以利用其购买力和强大的合作伙伴网络,帮助品牌在全球范围内找到需要的数据,再结合数据整合和落地效果分析,为客户创造了战略优势。
按照Merkle常用的用户生命周期来说,我们把用户的生命周期分成接触潜在用户(获客阶段)、老客维护(互动阶段)及留存分析(促使回购阶段)。在获客阶段,Merkle可以结合其他数据来源,丰富数据维度。比如我们在为某知名在线英语教育品牌服务中,由于客户本身数据不足以支撑建模,我们就利用运营商数据和某知名科技公司数据为客户做了数据增强,用户画像及建模准确度都提高了不少。
而且和运营商数据做对接有个好处,运营商天然有接触消费者的渠道,所以这个项目的第二阶段,我们会应用模型挑选最有可能转化的消费者,通过发短信、弹窗的形式,在合适的触点做营销活动。
如果是在互动阶段,数据维度越多,我们越能基于用户行为/状态对用户分群,实现个性化交互。举例来说,我们曾为NBA提供了Loyalty Plus平台解决方案,帮助客户打造出“NBA球迷圈“。”球迷圈”是Merkle通过收集、清洗和整合多个数据源的顾客数据,确立会员策略,为NBA中国建立的客户忠诚度系统,从而可以基于球迷的行为和状态建立球迷分群,个性化地实施与球迷的有效交互。
目前该忠诚度系统已有超过60万球迷注册,活跃用户达到64%,收集到的会员交互数据将用于客户分群和定制化的服务,实现营销上升闭环的效果。对于留存分析而言,更多的做竞品分析,了解用户为何流失。
在用户生命周期的不同时段,不同对应策略
Q:什么情况下公司会考虑利用数据分析/模型来做优化,具体怎么操作,落地效果又是如何评估的呢?
陈晨:从根本来说,数据分析/建模/统计等都是用来更科学的衡量数据资产的一些方法。就我的角度来讲,只要有数据,有余力,都可以尝试从数据中感知用户,提升营销效果。
我们姑且把公司分为两类,一类是注重用户增长型的企业,一类是注重客户维系的企业,当然这个划分不是很严格的,许多企业是两者并重的。注重用户增长意味着获客,获客没有哪个企业是不需要的,但是随着互联网的兴起,数据的兴起,获客在具体做法上有了很大的改变。
互联网刚兴起的时候,大家会发现网上获客又简单又便宜,比如在搜索引擎上投一投付费广告,或者做做SEO,效果很显著。
现在呢?网上的流量越来越贵,对于某些特定行业,比如汽车或者教育,一个销售线索的成本达到了几十甚至到几百人民币,所以如何在当下环境找到有效、便宜的方法来接触到更多的潜在消费者对企业来说是很重要的。
我们现在的做法是帮助客户量身打造一个精准获客的策略和完整的CRM(CustomerRelationship Marketing客户关系营销)解决方案。
首先了解到客户现有的获客流程,基于行业和客户自身特点提出解决方案,落地之后还可以通过与历史数据对比来看效果如何,在这个过程中我们又学习到什么,再去调整具体的操作或者实施步骤,形成闭环优化的结果。以某著名电脑品牌客户为例,原来的获客方法就是做线上线下活动,网上购买一些用户资源,但是我们可以帮他做细,我们可以通过模型来挑选出对品牌感兴趣的人群,在此基础上再做活动,省钱省力。
之后在转化阶段,原先客户的方法就是通过电话中心接触,或者直销的形式,我们可以丰富这些手段,比如可以结合数据来核实用户的真实意图和具体需求,在接触到的时候做到个性化推荐;或者可以用模型对这些用户做分群,之后再促进转化,都是非常好的方法。
Merkle CRM解决方案流程图
对于注重客户维系的企业,我们可以帮助企业建立用户价值和生命周期的体系。用户价值的主要目标是作为投资标准,而对用户的投资有多种形式:比如为高价值用户提供更频繁、便利的服务;在营销活动中为不同用户提供定制化的接触策略等。
我们在确定用户价值时会考虑很多因素,比如考虑到任期,流失,风险,营销和服务成本,交易历史以及预期的未来盈利能力和收入。而且用户价值会随着其生命周期的改变而改变,这是一个动态的过程,完全可以在这种变化中放大营销效果和增加决策正确性。还是举电脑行业的例子,我们可以结合用户历史购买/保修/网上浏览等行为,给每一个用户一个生命周期所在阶段,然后在合适的时间点接触到用户。
Q:能否给志在从事大数据行业的年轻人一些您的意见?
陈晨:我觉得从事大数据行业首先要可以沉得下心来,必须能够掌握一两种常用的数据分析工具,比如R,Python等,能够进行一定程度的编程,这样才能对数据理解和分析有一个直观的学习深入过程,也可以训练新人的数学和逻辑思维能力。
当然这是进入行业的基本前提。然后是要有一定的统计学基础和商业分析能力,能够迅速地从数据分析的结果中得出对商业运用或其他相关专业领域的洞察和应用方向。简单地说不是把模型跑出来,图表画出来就完事儿了,还需要能够从模型结果和数据可视化呈现中推断总结出后面真正的故事和意义。
在这些基本的能力和技能掌握后,要保持持续学习的心态,不断追随和了解行业最新动态和趋势,并能够横向进行多产业方向的融汇贯通。另外,大数据分析专业往往需要和不同部门,不同类型的客户进行沟通、讲解,所以如果在职业生涯的后端需要保持持续发展的竞争力,能用专业和非专业的语言和不同层次背景的合作方进行有效沟通也是必不可少的技能。
这次的访谈到此结束,谢谢陈晨分享关于数据整合/增强、数据分析和建模的一些项目经验。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21