京公网安备 11010802034615号
经营许可证编号:京B2-20210330
除了数据分析师,你还要扮演这些角色
作为统计系的学生,读书时就常常参加各种数学建模竞赛,也参与过一些市场调研和咨询的项目。在这个过程中,让我印象最深的不是数据处理和分析,反而是与人沟通的过程。
研一时,我与同学组成的团队参与了一个旅游策划公司的项目。我们作为乙方为甲方提供数据咨询。我们自己做数据收集、设计调查问卷。这是一个很复杂的过程,既要保证访问者的认可性,由于成本原因群体也不能太大。根据统计数据,我们给出一个旅游者的行为画像,根据出行的时间、频率、花费、交通工具等变量,采用聚类分析的方法,对用户进行细分,看他们分别适合什么样的产品。
我们调查的范围是重庆主城区,采样涵盖到不同景点、不同年龄段的人群。在做调查之前,我们去跑各个景区,跟游客聊天,对旅客的情况有一个“摸底”。我们去跟游客接触,去问问题,沟通这个环节至关重要。
工作之后,我越发觉得,身为分析师要具备一定的“公关”技能。
毕业之后我去了一家第三方支付公司。消费者刷卡时的个人信息存在一定安全隐患,我负责做线下的伪卡防范工作,就是从历史的安全隐患数据中发现问题,总结特征,建立危险识别模型,最终当交易发生的时候,通过概率值判断是不是盗刷。
风险控制是公司业务的支撑部门。公司的互联网业务会带来很多用户,支付是其中必不可少的一个环节,也是互联网金融的基础。
然而这是一个新行业,这意味着你没有扩样本。从几率学角度来讲,凡是有监督的模型,比如输入1到20个变量,输出只是一个变量,它只告诉你是或否,但拒绝还是不拒绝要自己判断。所以我需要去训练,训练是来自于历史数据的积累,没有历史数据就带来很大的困难,只能尝试建立半监督模型,在没有数据的情况下养数据。
我们提倡数据多维度、多样性,但你的数据权限可能是有限的,资源是有限的。在这个过程中你就需要接入其它部门的数据。你如何说服对方为你提供数据,这需要一定的沟通技巧和巧妙的专业呈现,让跨部门的同事信任你。
这个工作不能着急,要持续不断地沟通交流,时不时把你正在做的事情给对方看,让他了解你工作的内容,看到你的努力。
举个例子,在进行风险控制时,不可避免地会把用户体验降低。比如你在网上购买理财产品,注册一个账户,对密码的复杂度要求不够严谨,用户可能会觉得注册过程很方便流畅,但会带来风险。反之,比如12306以前出现过信息泄露的问题,它现在的验证码就变成图片验证,但过于麻烦,用户体验就不好。
产品部门的同事会考虑风险控制会降低用户体验,让用户流失。但如果后期出现了安全问题,你做的东西帮助他规避了风险,他就会理解你的工作,愿意用你的东西,所以你做的东西一定要有价值。对于这个问题,我们有时也会进行灰度测试,比较A版本和B版本在转化率上有什么差异,不断调整,在风险控制和用户体验之间找到一个平衡点。
销售
根据支持的工作,帮助他们的区域市场分析哪个项目是可以做的,该往哪个方向发展。我可以参与他们的销售会议,协助制定销售目标。在这个过程当中,我可以学到销售部门的人员是怎么考虑问题的。
后来又去了平安保险实习。当时去了平安产险管理部,我主要负责车商渠道的数据管理。比如,我想把一个保险卖出去,我们与车辆售后网点以资源换资源的方式合作。例如客户的车出现问题之后,他首先联系保险公司,保险公司再给客户推送网点。在推送的过程中,A店、B店怎么分配资源、具体的成本多少,需要建立一个模型,把推送方案最优化。建立模型时,你就需要有销售人员的思维。
杂家
想做数据分析师的同学学科背景不同,学计算机的编程很厉害,数学的更擅长纯理的东西。以我的经验来说,企业里许多岗位偏好学统计的。
如果做数据挖掘,偏理论性,可能喜欢用数学专业的学生;在企业里,经营管理、经营分析、风险管理等相关岗位更喜欢用学统计的;大数据中心涉及到数据产品的开发,更偏向于学计算机和数学的,但这都要求有一定的统计学思维。比如我看到一个数字的时候,我要联想它背后代表什么意义,看到A问题的时候不孤立地去看,善于与总体情况联系对比,既要看到总体也要看到差异。即便不是学统计出身,也要在平时的学习工作中训练自己。
互联网金融行业对人才的需求很大。我们招聘人才,一是要看你对金融产品的理解,二要看是否具有数据思维,具有一定的数据分析技能。还有一点很重要,要有热情,这个工作要重复很多事情,但不是机械的重复,也要进行思考,这都需要热情的支撑。
我建议同学们除了要打好基本功、熟练掌握1至2门编程语言之外,还要多接触数据,培养对数据的感觉;同时多研究不同的商业模式,研究不同的公司是怎么赢利的,天文地理历史人文,知识面要广博多样,让自己变成一个杂家,这可能会让你的数据分析工作更有想象力。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14