【CDA干货】次日留存率怎么算：从定义到实操，精准掌握用户留存核心逻辑-CDA数据分析师官网

热线电话：13121318867

首页大数据时代【CDA干货】次日留存率怎么算：从定义到实操，精准掌握用户留存核心逻辑

【CDA干货】次日留存率怎么算：从定义到实操，精准掌握用户留存核心逻辑

2026-05-09

在互联网运营、产品优化、用户增长等领域，次日留存率是衡量产品价值、用户粘性与运营效果的核心指标，更是判断新用户是否认可产品、能否实现长期留存的“第一道试金石”。无论是APP、小程序、网站，还是线上服务平台，次日留存率的计算结果，直接决定了运营策略的调整方向——高次日留存意味着产品核心价值被用户快速认可，低次日留存则提示需优化获客质量、产品体验或引导流程。但在实际操作中，很多从业者容易陷入“计算口径混乱”“数据统计偏差”“场景套用错误”的误区，导致计算结果失真，无法为决策提供有效支撑。因此，精准掌握次日留存率的计算方法、明确计算口径、规避常见陷阱，是每一位数据运营、产品从业者的必备技能。

次日留存率的计算并非简单的“次日活跃用户除以新增用户”，其核心是明确“统计对象、统计周期、活跃标准”三大核心要素，结合不同业务场景灵活调整计算逻辑。本文将从次日留存率的核心定义出发，拆解标准计算公式与不同场景的变体，提供从数据准备到结果验证的完整实操步骤，梳理常见计算误区与应对方法，结合多行业案例演示，帮助使用者快速掌握次日留存率的计算技巧，让数据真正成为运营决策的可靠依据。

一、核心认知：什么是次日留存率？

要精准计算次日留存率，首先需明确其核心定义——科学的次日留存率，本质是衡量“新用户转化为活跃用户的初始能力”，其统计对象严格限定为“新增用户”，而非所有活跃用户。谷歌官方对留存率的定义更为简洁：Percentage of new users who return each day，即每日新增用户中，后续每日返回使用产品的用户比例，这一定义同样适用于次日留存率。

具体来说，次日留存率是指：T日（新增用户当日）新增的用户中，在T+1日（新增次日）再次活跃的用户数量，占T日新增用户总数量的比例。这里的核心关键词的是“新增用户”“T+1日活跃”“比例”，三者缺一不可——若统计对象包含老用户，或活跃标准不明确，都会导致计算结果失去参考价值。

需要特别注意的是，次日留存率的核心意义的是“衡量用户对产品核心价值的初始认可程度”，而非单纯的“用户回访频次”。很多人混淆了“新用户次日留存”与“老用户次日回访”的概念：新用户留存下来成为老用户后，其次日回访应称为“用户访问频次”，而非留存率；若统计所有活跃用户的次日回访比例，会因用户构成差异（新老用户占比）导致数据失真，无法反映产品的真实留存能力。

简言之，次日留存率的核心价值，是通过量化新用户的“次日回归意愿”，提前预判用户生命周期走向——次日留存率越高，说明新用户越认可产品价值，后续转化为稳定用户、忠诚用户的概率越高；反之，若次日留存率过低，说明新用户在首次使用后未感受到产品价值，或体验不佳，需及时优化运营与产品策略。

二、核心公式：次日留存率的标准计算方法

次日留存率的计算有明确的标准公式，核心是“分子、分母的精准界定”，只要明确统计对象与统计标准，即可快速计算得出结果，公式如下：

次日留存率 =（T日新增用户中，T+1日活跃的用户数）÷（T日新增用户总数）× 100%

为了让公式更易理解，我们拆解分子、分母的核心定义，明确计算边界，避免因界定模糊导致误差：

（一）分母：T日新增用户总数

分母是计算的基础，核心是“T日首次接触并使用产品的用户数量”，需满足两个核心条件：一是“首次使用”，即用户此前未注册、未登录、未产生任何有效行为，属于新导入的用户；二是“有效新增”，需排除无效用户（如机器人注册、恶意刷单用户、重复注册用户），确保数据的真实性。

实操中，分母的统计需注意两点：1. 去重处理：同一用户在T日多次注册、多次登录，仅计为1个新增用户，需按照用户唯一标识（如设备ID、手机号、账号ID）去重，避免重复统计；2. 无效用户剔除：机器人、刷单用户等未产生真实使用行为的用户，需从新增用户总数中剔除，否则会稀释分母，导致次日留存率虚高。

例如，某APP在5月1日（T日）新增用户1000人，其中包含50个机器人注册用户、30个重复注册用户，经去重、剔除无效用户后，有效新增用户总数为920人，此处分母即为920。

（二）分子：T日新增用户中，T+1日活跃的用户数

分子是核心，重点是“限定范围+明确活跃标准”：限定范围为“T日新增的有效用户”，而非所有活跃用户；活跃标准需结合业务场景明确，避免因标准模糊导致统计偏差。

活跃标准的界定没有统一答案，需贴合产品形态与业务目标，常见的活跃标准包括：1. 登录行为：用户在T+1日成功登录产品，无论是否产生其他行为，均视为活跃；2. 有效行为：用户在T+1日登录后，产生核心行为（如浏览内容、完成下单、参与互动、使用核心功能等），才视为活跃；3. 时长要求：用户在T+1日登录后，使用时长达到一定标准（如≥5分钟），视为活跃。

需要注意的是，活跃标准一旦确定，需长期保持一致，不可随意变更，否则会导致不同周期的次日留存率无法对比，失去数据的参考价值。例如，某短视频APP将“活跃”定义为“登录并观看视频≥3分钟”，则T日新增用户中，仅在T+1日满足该条件的用户，才可计入分子。

（三）基础计算示例

结合公式与定义，举一个简单的实操示例，帮助快速理解计算过程：

某小程序T日（5月1日）新增有效用户800人（去重后，剔除无效用户），活跃标准定义为“登录并完成1次浏览行为”；T+1日（5月2日），该800名新增用户中，有240人再次登录并完成浏览行为。

则该小程序T日的次日留存率 = 240 ÷ 800 × 100% = 30%。

这个计算结果意味着，T日新增的用户中，有30%的用户在次日选择继续使用产品，认可产品的初始价值；剩余70%的用户未在次日活跃，可能存在获客质量、产品体验等方面的问题，需进一步分析优化。

三、不同场景的次日留存率计算变体

标准公式适用于大多数基础场景，但在实际业务中，不同产品形态、不同运营目标，对次日留存率的计算需求不同，需结合场景调整计算逻辑，常见的场景变体主要有3种：

（一）APP/小程序：基于设备ID/账号ID的精准计算

APP、小程序的次日留存率计算，核心是“用户唯一标识的精准统计”，常用的唯一标识包括设备ID、手机号、账号ID，优先选择“设备ID+手机号”双重去重，避免重复统计。

计算逻辑：以设备ID为唯一标识，统计T日首次安装并登录的设备数（分母）；统计T日首次登录的设备中，T+1日再次登录（或完成核心行为）的设备数（分子），代入标准公式计算。

实操注意：需排除“卸载后重新安装”的设备，此类设备不属于新增用户，若计入分母，会导致计算结果失真；同时，需区分“登录”与“活跃”，若产品核心目标是“使用核心功能”，则需以“完成核心功能使用”作为活跃标准，而非单纯登录。

（二）网站：基于Cookie/账号的去重计算

网站的次日留存率计算，核心是“区分新访客与老访客”，常用Cookie、用户账号作为唯一标识，其中Cookie适用于未登录用户，账号适用于已登录用户。

计算逻辑：T日通过Cookie或账号识别的新访客数（首次访问网站的用户，去重后）作为分母；T日新访客中，T+1日再次访问网站（无论是否登录）的用户数作为分子，代入公式计算。

实操注意：Cookie存在过期、清除的情况，可能导致部分新访客无法被准确识别，建议结合账号登录数据补充统计，降低误差；同时，需排除“同一用户通过多个设备访问”的重复统计，确保分母的准确性。

（三）数据库场景：SQL语句辅助批量计算

当用户数据量较大时，需通过数据库查询（如SQL）批量计算次日留存率，核心逻辑是“关联新增用户与次日活跃用户”，常用左连接（left join）实现数据拼接。

计算逻辑：首先筛选出T日新增用户（按用户唯一标识去重），作为左表；再筛选出T+1日活跃用户，作为右表；通过用户唯一标识（如device_id）将两张表关联，限定次日活跃用户的日期为“T+1日”（可通过date_add(date1, interval 1 day)筛选）；最后，以左表新增用户数为分母，右表关联成功的用户数为分子，计算平均次日留存率。

实操注意：SQL查询时，需按“用户唯一标识+日期”去重，避免同一用户同一天多次活跃被重复统计；子查询需全部重命名，遵循数据库语法规范；同时，需剔除无效用户数据，确保计算结果精准。

四、完整实操步骤：从数据准备到结果验证

无论哪种场景，次日留存率的计算都可遵循“明确标准→准备数据→计算结果→验证校准”的四步流程，确保计算过程规范、结果可靠，具体步骤如下：

第一步：明确核心计算标准

在计算前，需提前明确3个核心标准，避免后续统计偏差：1. 新增用户定义：明确“首次使用”的判定标准（如首次注册、首次登录、首次安装），确定无效用户的剔除规则（如机器人、刷单用户）；2. 活跃标准：结合业务目标，明确T+1日“活跃”的判定（如登录、核心行为、使用时长），确保标准可量化、可落地；3. 统计周期：明确T日与T+1日的时间范围（如自然日、24小时周期），避免跨周期统计导致误差（如T日为5月1日00:00-24:00，T+1日即为5月2日00:00-24:00）。

第二步：准备相关数据

根据明确的标准，收集并整理两类核心数据：1. T日新增用户数据：包含用户唯一标识、新增时间、注册渠道等信息，对数据进行去重、剔除无效用户处理，得到有效新增用户总数（分母）；2. T+1日活跃用户数据：包含用户唯一标识、活跃时间、活跃行为等信息，筛选出“T日新增的用户”在T+1日的活跃数据，去重后得到符合条件的活跃用户数（分子）。

数据准备注意：需确保两类数据的用户唯一标识一致（如均使用设备ID），避免因标识不一致导致无法关联；同时，需检查数据完整性，剔除缺失关键信息（如新增时间、活跃时间）的数据，降低误差。

第三步：代入公式计算结果

将整理后的分子、分母数据，代入次日留存率标准公式，计算得出结果，保留1-2位小数，便于后续分析对比。若数据量较大，可通过工具辅助计算：Excel可通过VLOOKUP函数关联新增用户与活跃用户，统计符合条件的用户数；SQL可通过左连接查询批量计算；专业数据工具（如AnalySDK、神策数据）可直接筛选参数，自动生成次日留存率结果。

第四步：验证与校准结果

计算完成后，需对结果进行验证，避免数据统计或计算错误：1. 去重验证：检查新增用户、活跃用户的去重情况，确认无重复统计；2. 范围验证：次日留存率的结果范围应在0-100%之间，若出现超过100%或负数，说明数据统计存在错误，需排查分母、分子的界定问题；3. 对比验证：将计算结果与历史同期数据、行业均值对比，若出现异常波动（如突然飙升或暴跌），需排查数据来源、统计标准是否发生变化，确保结果可靠。

五、常见计算误区：避开这4个陷阱，确保结果精准

在实际计算中，很多从业者容易陷入以下4个误区，导致计算结果失真，无法为决策提供有效支撑，需重点规避：

误区1：混淆统计对象，将老用户纳入计算

最常见的误区是，将“所有活跃用户的次日回访数”作为分子，而非“T日新增用户的次日活跃数”，导致次日留存率虚高或失真。例如，某APP T日新增用户500人，老用户活跃1000人，T+1日总活跃用户800人，其中新增用户活跃150人、老用户活跃650人，若误将800作为分子、500作为分母，会得出160%的错误结果，正确计算应为150÷500×100%=30%。

误区2：未去重或去重不彻底，重复统计用户

未对新增用户、活跃用户进行去重处理，导致分母、分子虚高。例如，同一用户在T日多次注册，被重复计入新增用户总数；同一用户在T+1日多次活跃，被重复计入活跃用户数，都会导致次日留存率计算结果偏离真实值。实操中，需按用户唯一标识（如设备ID、手机号）严格去重，确保每个用户仅被统计一次。

误区3：活跃标准不明确或随意变更

未明确活跃标准，或不同周期采用不同的活跃标准，导致不同时期的次日留存率无法对比。例如，某产品本周将“活跃”定义为“登录”，下周改为“登录并完成下单”，两次计算的次日留存率差异较大，无法反映产品留存能力的真实变化；此外，若活跃标准过于宽松（如仅登录1秒即视为活跃），会导致分子虚高，留存率失真。

误区4：忽视无效用户，未进行剔除处理

未剔除机器人、刷单用户、恶意注册用户等无效数据，导致分母虚高，次日留存率虚低。例如，T日新增用户1000人，其中包含300个机器人注册用户，若未剔除，分母为1000，实际有效新增用户为700，若分子为210，错误计算结果为21%，正确结果应为210÷700×100%=30%，两者差异较大，会误导运营决策。

六、多场景实操案例：手把手教你计算次日留存率

结合APP、网站、数据库三个常见场景，拆解完整计算流程，提供可直接参考的案例，帮助快速掌握实操技巧：

案例1：APP场景——某社交APP次日留存率计算

明确标准：新增用户定义为“首次注册并登录的用户”，剔除机器人、重复注册用户；活跃标准为“登录并发送1条消息”；统计周期为自然日。

数据准备：T日（5月1日）新增注册用户1200人，去重、剔除200个无效用户后，有效新增用户1000人（分母）；T+1日（5月2日），该1000名新增用户中，有350人登录并发送1条消息（分子）。

计算结果：次日留存率 = 350 ÷ 1000 × 100% = 35%。

结果分析：35%的次日留存率在社交APP行业属于中等水平，说明新用户对产品的初始认可度较好，但仍有65%的新用户未在次日活跃，可进一步优化新用户引导流程、提升产品互动性。

案例2：网站场景——某电商网站次日留存率计算

明确标准：新增用户定义为“首次访问网站的访客”，以Cookie+账号双重去重；活跃标准为“登录并浏览商品≥5分钟”；统计周期为自然日。

数据准备：T日（5月1日）新增访客800人，去重后有效新增用户750人（分母）；T+1日（5月2日），该750名新增用户中，有150人登录并浏览商品≥5分钟（分子）。

计算结果：次日留存率 = 150 ÷ 750 × 100% = 20%。

结果分析：电商网站20%的次日留存率属于正常范围，可通过优化商品推荐、提升页面加载速度、发送个性化提醒等方式，提升新用户次日留存率。

案例3：数据库场景——SQL批量计算次日留存率

明确标准：新增用户定义为“首次登录的用户”，以device_id为唯一标识；活跃标准为“登录行为”；统计周期为自然日，使用SQL查询批量计算。

数据准备：数据库中存在用户登录表（user_login），包含device_id（设备ID）、login_date（登录日期）字段。

SQL查询逻辑：1. 筛选T日（2026-05-01）新增用户，去重后作为左表；2. 筛选T+1日（2026-05-02）活跃用户，作为右表；3. 左连接两张表，关联条件为device_id，筛选右表login_date = date_add('2026-05-01', interval 1 day)；4. 统计左表总数（分母）、右表关联成功数（分子），计算平均次日留存率。

SQL语句示例：select count(b.device_id)/count(a.device_id) as day1_ret from (select distinct device_id from user_login where login_date = '2026-05-01') a left join (select distinct device_id from user_login where login_date = '2026-05-02') b on a.device_id = b.device_id;

计算结果：若查询得出count(a.device_id)=1000，count(b.device_id)=320，则次日留存率 = 320÷1000×100% = 32%。