在统计学的应用中,有一些方法与回归这类定量数据为主的分析不同,他们更倾向于定性的分析,比如判别,比如聚类……这类分析或许搞经济的,搞金融的不太会去使用,但在医药,咨询服务类公司则会经常(或相比经济金融 ...
2014-07-04
传统的多元线性回归模型中,总是存在一个基本假设:解释变量为非随机变量且彼此间互不相关(实际上一般只要求不存在完全共线性),随机误差项相互独立且服从零均值同方差的特性。那么这次,我们就来看看时常困扰我们 ...
2014-07-04
之前做的几个系列都得到了大家的支持,也有很多童鞋指出了楼主写的纰漏,楼主很感谢大家(这样才能有进步嘛……)。 那么这次楼主想说说抽样的问题。抽样这个话题,其实有那么点……一般作分析的都是处于数据处理 ...
2014-07-04
哈哈,楼主此次的标题起得有点粗俗,这个P当然不是屁,而是指软件中那个常常出现的P值。不管有没有学过统计,相信很多同学(包括楼主)在刚开始接触P值时,对它的理解多少有点云里雾里的,以至于在做模型检验的时 ...
2014-07-04
T检验是统计推断中常用的一种检验方法,在统计分析中,它主要用于检验参数的显著性。前一次,我们已经讲了假设检验的一些初步知识,那么这些T检验啊F检验啊,都是建立在假设检验的基础上的。 首先我们简单了解一 ...
2014-07-04
1、什么是假设检验? 个人理解,假设检验就是利用反证法和小概率事件对原假设(Null Hypothesis)和备选假设(Alternative Hypothesis)进行选择。首先,假设原假设成立,那么就可以利用原假设的一些条件,如统计 ...
2014-07-04
在估计方法中,最大似然和最小二乘是经常被使用到的,其中的最小二乘更是回归的基础。楼主在刚接触最小二乘的时候曾经想过一个问题,为什么非要用平方?绝对值不行么?……很多问题萦绕脑中。最近借着做专题的时间, ...
2014-07-04
前两期楼主分别作了均值和拟合优度的专题,今天就来说说置信度。 要说置信度,首先老师肯定会在此前已经介绍过了点估计了,那么引入这个概念的目的自然是为了配合一个叫做区间估计,估算置信区间。通常都是用点估计 ...
2014-07-04
前几天逛知乎的时候看到一个帖子,学计量的和学统计的在争论关于anova里的可决系数的问题。突然萌生了一个念头,想听听大家对这个R2是怎么理解的。(引用的知乎链接,大家可以前去看看http://www.zhihu.com/quest ...
2014-07-04岗位职责: 1、业务端常规日报、周报、月报等数据报告编撰; 2、各类业务数据分析报告; 3、根据业务需求,定期订正或修正KPI指标,保持指标合理性; 4、业务部门关键KPI追踪、督导与分析,促进业 ...
2014-07-04自7月1日起,所有服务于京东商户的第三方服务商(以下简称ISV)产品必须通过其“宙斯”云平台在线销售,并同步废除之前对商家的API接口认证授权,商家只有通过在线购买相关软件,才能重新获得授权调用数据。 ...
2014-07-04
为适应当今社会对各行业信息化提出的新要求,深化信息社会条件下高等教育中的数据科学的研究与应用,促进中国人民大学在学科建设、教学研究以及科研成果产业化的发展,7月1日,中国人民大学与北京国双科技有限公 ...
2014-07-04
《爸爸去哪儿》第二季自开播以来一直广受关注。截至目前,两期节目在其独播视频网站爱奇艺、PPS已斩获1.7亿次播量,一众星爸萌娃也随着节目热播一路人气飙升。在爱奇艺大数据报告中人气领跑的吴镇宇和黄磊,也成功 ...
2014-07-04
6月29日,由新金融联盟主办的“首届新金融联盟峰会暨金融极客盛典”在国家会议中心举行,来自政、商、学界的重要人士应邀出席峰会,并以“新金融时代:变革的力量”为主题展开演讲与讨论。 与会的网信金融 ...
2014-07-04
开源大数据Hadoop社区内专注于可用性和数据安全优化的MapR周一宣布,该公司通过股权和债券融资的方式最新筹集了1.1亿美元资金。 Hadoop是一种开源大数据技术,这种由Apache基金会(Apache Foundati ...
2014-07-04
世界杯火热来袭,点球、越位、内马尔……人人饶有兴致堪比专家。但据QQ大数据发布的《中国球迷报告》显示,今年男球迷和女球迷看到的根本不是同一届世界杯。 首先,QQ大数据显示,所有球迷中,80后以65%的 ...
2014-07-04阿里巴巴电子商务生态圈峰会日前在深圳召开。阿里巴巴中国供应商广东大区负责人余涌、阿里巴巴副总裁车品觉在接受证券时报记者采访时表示,阿里巴巴正在凭借强大的平台力量、大数据体系以及服务体系,带动中小企业 ...
2014-07-04银泰商业昨日最新公告称,6月24日举行的股东特别大会正式通过议案,同意向阿里巴巴配发及发行认购股份及转换股份。与此同时,中国银泰投资有限公司董事长沈国军透露,阿里巴巴集团战略投资银泰商业后,双方将深化 ...
2014-07-04随着我国汽车数量逐渐增多,交通拥堵以及环境问题日益严重,智能交通逐渐受到重视。在近日的“第五届中国智能运输大会暨第三届深圳国际智能交通与卫星导航位置服务展览会”上,中兴提出,在建设“智慧城市”的规划 ...
2014-07-04在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29