刷抖音会影响学习吗？相关和因果初探-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读刷抖音会影响学习吗？相关和因果初探

刷抖音会影响学习吗？相关和因果初探

2020-09-03

作者：丁点helper

来源：丁点帮你

前面，我们详述了各种检验方法的基本逻辑以及实操过程，包括t检验、方差分析、卡方检验、和基于秩次的非参数检验，从今天开始，我们就要进入一个新的主题——相关与回归。

相关与回归，尤其是后者，在卫生或医学统计学中应用的十分广泛。这两种方法都是在探寻两个或两个以上变量之间的关联，或者称“相关关系”。

可是，我们做研究的终极目标并非是为了获得“相关”，而是获得“因果”。

某种疾病病死率的下降与使用新药有关，这里的有关，实际上在暗示，新药的使用，导致了病死率的下降，这里的“导致”就表明产生了因果关系。

相关是比因果更宽泛的概念，两个变量存在因果关系，几乎可以肯定会存在相关关系（不限于线性相关）；但反过来，却不能成立，具有相关关系的数据，并不一定存在因果联系。

统计书中举的最简单的例子是“小树的身高和小孩的身高”——小树长、我也长，从数据来看，它们存在非常显著的相关关系。

但是，有何意义吗？并没有。我们并不能从这两个数据表面的相关来推导出小树身高对小孩身高造成何种影响？

是的，无论是简单的单因素假设检验（如两组样本的t检验），还是纳入了多个因素的线性回归分析，本质上，我们是希望获得一个因素对另一个因素的“影响”。

产生影响意味着什么呢？意味着发生了因果关系。

比如有人说“刷抖音影响学习”，把这句话用统计的语言来表达和验证就是：抽取一群学生，随机分配到两组，一组天天刷抖音，另一组不刷，然后比较两组学生的平均成绩。

如果抖音组的成绩低，那我们就可以下结论说：刷抖音影响学习，更准确地说，刷抖音导致学习成绩下降。同样，注意这里的用词，“导致”意味着因果关系。

以上当然是一个不严谨的“随机对照试验”，存在很多漏洞值得讨论。但我们举这个例子的意图只是想让大家明白，如果你想验证“因果关系”，理论上，这或许是唯一准确的办法。

再往深想一想，或许也不应该称为“理论上“唯一准确的办法，而应该称作“具有实现可能”的唯一准确办法。

言外之意，还有不可实现的方法吗？

是的，要做因果推断，最准确的应该是通过构造”反事实“来实现。

什么叫反事实？它是根据英文翻译过来的，叫做counterfactual facts，看第一个单次的词根”counter“就是”反、对抗“的意思。说起来似乎很拗口，但理解起来并不费劲。

仍以上面刷抖音和学习的例子来看，怎样通过构造”反事实“来探究这两者之间的因果关系呢？

很简单，让一个特别喜欢耍抖音的小朋友一直刷，然后记录其期末考试成绩；还是这个小朋友，让它做时光机重新回到学期开始的时候，什么都不变，唯独一点变了——没有抖音了，然后再看这个小朋友期末考试成绩。通过比较他的两次成绩，就能准确地判断出”刷抖音是否影响了他的学习“。

这就是所谓的”反事实“，因为他刷抖音这是个事实，在现实生活中，我们是无法改变这个事实的，所以只能通过在脑海中构建”他不刷抖音“这个反事实。实际上，因果推断的金标准——随机对照试验，就是一种模拟”反事实“的方法。

绕这么大一个圈给大家讲反事实，就是想提醒大家，因果关系推断之难。

别说反事实，就是随机对照试验，对很多研究来讲都是不可能实现的。

我们唯一（或者大部分）能获得就是眼前看到的这个世界发生的一切——所谓的”观察性数据“（Observational data），可我们的目的偏偏是希望从这些”观察性数据“中间获得”因果性推断“。

当我们采用统计方法来探究变量间的关系时，我们应该保持谨慎，因为几乎所有的方法都是在进行”相关关系“的探究，而非”因果关系“，这一点是我在咱们这个系列文章的开头想跟大家讲的。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

线性回归方差回归分析假设检验非参数检验方差分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇python到底是强类型语言，还是弱类型语言？

下一篇python之shutil模块11个常用函数详解

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

刷抖音会影响学习吗？相关和因果初探

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

从“杂乱信号”到“有序资产”：CDA数据分析师视角 ...

CDA持证人专访：周婧博谈会计行业数据分析与经营诊 ...

【CDA干货】问卷调查卡方检验：原理、前提与实战应 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载