Python 爬取了马蜂窝的出行数据,告诉你这个夏天哪里最值得去 正值火辣的暑假,朋友圈已经被大家的旅行足迹刷屏了,真的十分惊叹于那些把全国所有省基本走遍的朋友们。与此同时,也就萌生了写篇旅行相关的内容 ...
2018-08-14
花式玩逻辑回归之不是只能做二分类 最近忙了一些,懒也有啦,就没怎么看书,发现一些新的东西,所以更新慢了,之前有个朋友叫我写避免过拟合,但是这个题目真的好广泛,我还没看透,所以这个可能后续再写,今天 ...
2018-08-14
统计学上的P值的含义通俗 首先解释下“有统计学意义”和“显著差异” 两个概念: ”有统计学意义\"和\"差异显著\"是两个不同的概念,\"差异显著\"易给人一种误导, 原来两概念在统计学中经常有点通用,现在明确 ...
2018-08-14
假设检验中的P值 与显著性水平的联系 假设检验是推断统计中的一项重要内容。用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另 ...
2018-08-14
python numpy 一维数组转变为多维数组的实例 今天小编就为大家分享一篇python numpy 一维数组转变为多维数组的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 如下所示: import n ...
2018-08-14python中numpy的矩阵、多维数组的用法 1. 引言 最近在将一个算法由matlab转成python,初学python,很多地方还不熟悉,总体感觉就是上手容易,实际上很优雅地用python还是蛮难的。目前为止,觉得就算法仿真研 ...
2018-08-14
基于Python中numpy数组的合并实例讲解 下面小编就为大家分享一篇基于Python中numpy数组的合并实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 Python中numpy ...
2018-08-14企业大数据应用三段论 随着云计算、物联网和开源大数据技术生态的高速发展,企业获得大数据相关基础设施技术和服务越来越容易。虽然现阶段大数据成熟应用多在互联网公司,但我们需认识到,一方面,大数据应用是 ...
2018-08-14
数据分析方法论:你真的懂 Session(会话) 分析吗 在数据分析领域,Session是一种专业的数据分析。对于有数据驱动意识的互联网人来说,这并不陌生——Session 即会话,是指在指定的时间段内在网站上发生的一系 ...
2018-08-14
盘点机器学习中那些神奇的损失函数 我最近在学习R语言,但是估R语言我应该没能跟sas一样玩那么好。今天来更新在机器学习中的一些专业术语,例如一些损失函数,正则化,核函数是什么东西。 损失函数:损失函 ...
2018-08-14
机器学习中的损失函数 损失函数(loss function)是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是 ...
2018-08-13
机器学习中的参数与超参数之间的区别 机器学习中的模型参数和模型超参数在作用、来源等方面都有所不同,而模型超参数常被称为模型参数,这样,很容易对初学者造成混淆。本文给出了模型参数和模型超参数的定义 ...
2018-08-13
产品和运营,你为什么做不好转化分析 对于一款产品来说,如何让用户更好地转化,是用户能否留存下来产生价值的关键因素。 对于运营来说,广开源路寻找目标用户,甚至还要选择一些付费渠道(如下图)进行投 ...
2018-08-13
现代数据中心六大优化趋势 能源成本仍然是数据中心增长最快的费用,据说超过了计算设备本身的成本。电力使用效率(PUE)和碳使用效率(CUE)是国际公认的指标,与更多其他的定义指标一道,将成为行业标准。新 ...
2018-08-13
机器学习之支持向量机(SVM) 支持向量机算法在深度学习没有火起来的2012年前,在机器学习算法中可谓是霸主地位,其思想是在二分类或者多分类任务中,将类别分开的超平面可能有很多种,那么哪一种的分类效果是最 ...
2018-08-13
python中验证码连通域分割的方法详解 这篇文章主要给大家介绍了关于python中验证码连通域分割的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用python具有一定的参考学习价值,需要的朋友们下 ...
2018-08-13
大数据在互联网用户系统中的应用 但是对于今日的互联网和移动互联网,大数据的规模和应用深度早已不次于传统的电信、民航等行业,甚至超过不少。因此笔者还是想写些东西浅谈一下互联网的大数据应用,权当抛砖引 ...
2018-08-13
Python简单实现的代理服务器端口映射功能示例 这篇文章主要介绍了Python简单实现的代理服务器端口映射功能,结合实例形式分析了Python模拟服务器、代理服务器及客户端访问的相关操作技巧,需要的朋友可以参考下 ...
2018-08-13互联网公司是如何做大数据的 大数据”炙手可热,很多企业都不会错失机会,谷歌已经从一个网页索引发展成为一个实时数据中心枢纽,可以估量任何可以测量的数据,将输入的查询与所有可用数据相匹配 ...
2018-08-139种人人都应该掌握的数据分析思维 1. 分类 分类分析的目标是:给一批人(或者物)分成几个类别,或者预测他们属于每个类别的概率大小。 举个栗子:“京东的用户中,有哪些会在618中下单?”这就是个典型的二分 ...
2018-08-13金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04