京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA数据分析师 出品
各位同学大家好,我目前就职于某头部互联网电商大厂的产品运营部门。
今天我给大家分享一下头部互联网电商大厂的面试流程,我的一些日常工作内容,另外再给大家介绍一些相关工作案例。
面试流程是怎样的
首先让我们看到面试流程。
就我所在的公司为例,当我们投递简历后,首先HR会对你的简历做筛选,再HR这一关过了之后再投递给技术,接着技术或者业务会对你进行面试,技术这边觉得合适后,还会有Boss会面,主要考察你的逻辑或者表达各种能力。Boss面完之后,最后还有HRBP,可能跟你谈一些未来职业规划,具体福利等内容。
但对于大多数人而言,投简历给头部大厂时,简历筛选阶段可能就是一个非常大的问题。
其实大厂内部也是非常缺人的,但是在简历筛选部分大厂有自己的标准,要求比较高。所以说HR简历筛选和技术用人需求是有所矛盾的。
有一种解决办法就是,可以通过内推。如果在大厂有认识的人,可试着把你的简历发给他,可以让他直接发给技术或者业务,这样面试官直接对你进行面试。如果说技术认可的话,技术再把你的简历投递给HR,直接告诉HR说这个人我要了,HR再对你进行相应的录用。因此这种方式能够一定程度上解决第一阶段简历筛选的问题。
再聊聊我自己的情况,当时CDA佟老师直接把我的简历推给了现在我所在的公司。公司对我进行了技术相关的面试。他们会问的非常细,你简历上的每一条你写的技能,还有你的工作经历,只要和他业务相关都会问。而且会深挖,比如说当时我在简历上写到我会爬虫,除了问问一些爬虫相关知识以外,他还会问到你有没有了解一些反扒的东西。还有随机森林等机器学习相关的内容。另外还有我在简历上写到,我之前做过图片的文字识别,里面用到了OCR技术,那么面试官就会问你,OCR技术它的底层原理是什么,会类似这样深挖地去问你。
关于日常工作的内容,首先是一些流程性的。比如说有早会,然后有周会,日报和周报这些也是每天要提交的。
在我初到公司的这几周,我学到更多的应该是一种流程。我的leader会让我梳理各种的工具包。首先是各种的sop,每个节点都梳理一个工具包。只看流程,每一个流程跑通,跑通之后就再无限的复制。每一个流程的节点都会让我梳理一些工具包。比如说下层业务的工具包,宣传物料的工具包,平台使用的工具包等等。
无论对内还是对外,都要根据所处的流程,按流程一步步走。基本上都是按这种流程式的工作。
下面再给大家介绍一些数据分析的案例。
基于RFM模型的用户精细化管理
这在企业中会怎样应用呢?
用户画像包含了基本属性和高级属性,RFM模型就是它高级属性里面的一部分。
首先用画像的基本属性,像用户登录名、用户级别、性别、年龄、婚姻状况、学历、职业等这些指标都是可以轻易获得的。
此外一些深层需要挖掘的指标。比如说是否有小孩,小孩多大,小孩的性别,以及家庭是否有车,购买力怎么样。
还有RFM挖掘出来的一些信息,比如说用户属于RFM模型里面哪个分组,然后它的标准化得分是多少,是不是我们的价值用户,以及其忠诚度等信息,这些都是需要我们建立RFM模型这样的算法来把深层指标给挖掘出来的。
再给大家介绍一个用户画像和精准营销相关的案例。比如电商平台A和B培训机构合作推出课程,A平台要帮B机构做营销活动--短信营销。短信营销的话就需要B机构提供一些用户的基本属性,比如年龄、职业、学历、城市等等基本信息。然后再给A平台这边提供一些案例,比如说在A平台搜索过Python、MySQL、Excel、数据分析等关键词的一些场景,把这些场景交给A平台专门负责短信营销的部门,把这些指标交付过去,那边对把A平台的指标体系和B机构的指标体系做匹配。
接下来是RFM模型这些概述性的知识,大家应该都在课程中应该都学过了。
它的主要用途就是帮助卖家更好了解自己的客户,然后便于精准的指定营销活动提升转化率,还有帮助卖家分析进行的销售情况。
这里是我公司用画像体系的一部分,它的标签名称,一些算法和应用场景模型解释等等。
首先用户登录名的主要就是营销定位人群。
这个怎么解释呢?比如说刚才的短信营销,A平台这边从用户画像库里面提取出来的,每一个用户名对每一个人。然后主要是用来营销定位一个人群,然后用户级别主要用的是一些统计算法,然后主要用的场景就是可以定位人群,或者是进行行为划分。模型解释就是根据用户购物的评论和累积成长等,对用户进行一个等级划分,应该跟支付宝的会员级别应该是比较像的。
用户年龄、婚姻状况、学历、职业等都是通过一些算法,这些通过算法把它划分出来,还有一些具体的应用场景我们就不做细说了。
电商销量预估
销量预估一个典型的应用场景是企业进销存的一个库存管理。
对于电商公司来说,它要解决的一个非常大的痛点就是进销存,就是我要保证仓库的货物够我卖,同时我又不能过多的进货,因为仓储能力和资金是有限的。
另外还要面临一个问题,像一些大促活动比较,比如双11、618这些大促,我还要保证我这个时候的库存能满足需求,不能出现供不应求的情况。
如果说要做经销层管理的话,你就要用到销售预测。
销量预测它基本上有三种算法,统计算法、计学算法和深度学习算法。
统计算法的话,比如同年1月环比移动平均法。一年中有很多个月份,要预测某一个月份的销量,那么就根据就近原则,离这个月份更近的月,它的权重就更大,远一点权重就次之。
所以说就可以建立一个这样的权重之后,除以所有的权重总和,那么就可以得到较为近似的销量预测。
有一些数据它可能季节性波动比较大,然后我们还可以用到的就是比如一年同月同比移动平均法。就是不同年份的同一个月份,它的销量可以来消除季节性误差,还是根据就近原则,可能离今年更近的这些日期,它的一个权重就会更高。
其实就是机器学习算法的一个预测,比如下面这个表格。
有10个用户,已知他的搜索次数,有它的浏览次数,那么根据这些数据我就可以来预测他是否购买,可以用到一些算法,比如LightGBM、Prophet等算。
具体的建模流程,就首先采集数据,然后数据清洗数据预处理和特征工程。这些数据清洗、数据预处理和特征工程,它主要目标都是为了对数据集做一个清洗,清洗之后把模型指标给提取出来,列出来之后就开始进行模型开发,建完模之后进行模型调优,之后对我们的数据进行验证和迭代。
接着就是深度学习算法。
比如说LSTM这个算法,有一个之前做的案例,判断大黄蜂报告真实性。背景是一个地方出现了一个新物种,我有这个物种在历史上的一些停留的地点,那么我需要根据这些停留的地点来预测他下一次可能出现的地点。当时就建立了LSTM这个模型来进行预测,准确率还是蛮高的。实际预测出来的跟真实的数据值只相差了700多米,这是美国一个州的范围,精度是相当高的。
C2M反向定制和新品分析
C2就是传统的电商模式,就是工厂到消费者,品牌公司把设计好的产品交给工厂,由工厂来通过终端来送给消费者,确保产品的合理,同时质量服务都有保障,为消费者提供性价比比较高的产品。
像自营类的F2C电商,例如网易严选、淘宝新选、京东京造,开放平台类的F2C电商,如网易考拉工厂店、拼工厂。C2M是用户直连制造,是一种新型的工业互联网电子商业模式,被称为“短路经济”,它主要是弥补传统的F2C电商模式的一些不足,比如说自营模式它的品牌是属于自己,它能弥补刚才我们说的不不足。
传统F2C有一些特点,首先就是我设计的一些产品,然后这些自己拥有这些品牌。
然后第二个特点就是先生产后销售,然后面临一些库存压力。第三就是重产品设计,重品牌定制化,产品严重快时尚品。第四个就是需要舆情洞察,用户行为分析来设计新品。
主要是下层的营销和运营层来辅助和上层,从设计到生产再到同样市场。新品分析的重要性,新品当然代表了新技术、新设计、新功能、新体验和更好的利润,新品将成为品牌商提前占领行业的先机,然后成为品牌竞争中强有力的一环等等。
根据大数据显示,2018-2020年新品发布量是迅迅猛增长的,2020年1月的单月新品发布量超过2018年全年,2021年第一季度单季新品发布量已接近2019年全年发布量的90%,所以说新品迭代速度是比较快的。
触点分析
首先什么是触点?一切被用户触达,甚至感觉到对象都可以称之为触点。就像你进入电商平台,然后有一些什么秒杀、优惠券、发现好物、领券中心、每日特价为你推荐等这些都是触点。
触点可以理解为被你点击的东西,它的主要作用是把你的行为给数据化,通过来设计一个又一个的触点,就可以知道你的行为。你每点一下,然后后台都是有记录的,然后他就会分析哪些触点更能吸引你。
触点的应用,更好增加用户体验,目标是如何通过触点来满足用户的需求,如何设计触点来获取用户的信任,然后如何设计触点使之更高效,降本。
触点与需求的因果关系,先有需求还是先有触点?
这个没有一个必然的关系,你首先根据需求设计触点,但是进行分析的时候,触点记录的数据进行分析的时候可能产生新的需求,然后你还需要优化迭代触点。
消费者资产模型
首先这个模型的概念,用户对一件商品的认知和理解,就是一定通过某种感官触达的,也就是我们的第一个认知,比如蛋糕店附近有香味,这就是为了来触发你的味觉。大众汽车广告公司结尾的时候,是为了来触达你的听觉。店铺的装修为了来触达你的视觉。
然后首先触达,触达之后,然后你对这个品牌有些认知之后,再吸引之后,然后再采取行动,采取行动之后再让你维护这个品牌。然后品牌用户的资产的意义在于让平台和品牌商知晓自己的用户到底有多少,在哪里转化,过程是否健康,从而做出针对性的营销动作。
这些还这刚才说的4个指标:认知,我认知用户有多少;吸引,从认知到我吸引过来的用户多少;然后哪些用户采取了行动,最后哪些用户变成了忠诚用户。
这有一个案例,比如说今年有一个品牌的ROI非常低,然后需要我们去诊断问题。
那么怎么来发现哪里出问题了,这就需要这就可以用到C模型。C模型的话,首先有多少用户,活动期4A关系加深率。可以看到认知到兴趣丢失了10%,那么这个是丢失的,就是认知到兴趣,然后再到行动,反正各个环节你都可以有一些指标来定义,定义的话哪个环节出问题了,你就可以直接发现,然后进行调整。
以上就是我本次的分享,希望对大家有所帮助。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14