不平衡数据分类算法介绍与比较 在数据挖掘中,经常会存在不平衡数据的分类问题,比如在异常监控预测中,由于异常就大多数情况下都不会出现,因此想要达到良好的识别效果普通的分类算法还远远不够,这里介绍几 ...
2018-04-01
机器学习中的数据不平衡解决方案大全 在机器学习任务中,我们经常会遇到这种困扰:数据不平衡问题。 数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统 ...
2018-04-01我们应以何种思维方式来适应大数据时代 目前,在报刊文献和各种媒体中,大数据这个概念,几乎是处处可见、不绝于耳;同时,学术界的学术研究,使人们对大数据的理性认识水平不断提高。有学者认为,2012年世界 ...
2018-04-01【北京凯因科技股份有限公司】招聘数据分析师 北京凯因科技股份有限公司(以下简称凯因科技)成立于2008年,注册资本11500万元。位于素有“药谷”之称的北京经济技术开发区。凯因科技以生物技术为平台,专注于肝病领 ...
2018-03-31【成都名文建筑装饰设计有限公司】招聘数据分析师 名文建筑装饰公司是集室内设计、开发、预算、施工、材料于一体的专业化设计公司。公司从专业的设计和可实现性的角度上,为客户营造更温馨和舒适的家园。 职位月薪 ...
2018-03-31【国电南瑞轨道交通技术分公司】招聘数据分析师 轨道交通技术分公司作为国家电网公司直属产业单位南瑞集团公司旗下上市公司—国电南瑞科技股份有限公司的下属分公司之一,是国内唯一同时掌握城市轨道交通电力自动化 ...
2018-03-31
Python栈算法的实现与简单应用示例 本文实例讲述了Python栈算法的实现与简单应用。分享给大家供大家参考,具体如下: 原理: 栈作为一种数据结构,是一种只能在一端进行插入和删除操作。它按照先进后出的 ...
2018-03-31
Python with语句上下文管理器两种实现方法分析 本文实例讲述了Python with语句上下文管理器。分享给大家供大家参考,具体如下: 在编程中会经常碰到这种情况:有一个特殊的语句块,在执行这个语句块之前需 ...
2018-03-31
深入解析Python中的上下文管理器 Python中把进入代码块前调用__enter__ 方法并在离开代码块后调用__exit__方法的对象作为上下文管理器,本文中我们就来深入解析Python中的上下文管理器,来看看上下文管理器的作用 ...
2018-03-31
机器学习4种不同数据集的优劣对比 数据源决定了机器学习算法,机器算法的选择好坏也决定了数据的分析质量等,因此,我们选择机器算法的时候,要首先弄懂各个机器学习数据集的优劣性,主要特点,方可着手处理, ...
2018-03-31
浅谈数据分析中的“暗物质” 我们分析数据,更重要的是看到数据中所隐藏的暗物质,即数据图中你看不见的数据\\逻辑\\知识。 开门见山,以下是某新闻媒体WAP\\APP\\PC三端的分周中和周末的PV曲 ...
2018-03-31机器学习中的数据集合 数据集分类 在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train set) 验证集(validation set) 测试集(test set)。 训练集用来估计模型,验证集用来确定网络结构或 ...
2018-03-31
移动大数据的四个发展趋势 如果我告诉你,你可以做到从海量数据来源(包括各种各样的移动设备)中把数据提取到一个系统,然后只用少量的程序行数描述所需的信息就可以让结果轻松呈现,还可以做到实时处理这些数 ...
2018-03-31
最流行的4个机器学习数据集 机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很重要。本文作为学习研究数 ...
2018-03-31区块链火热应用场景成关键 业内:今年是落地好时机 数个月前,人们似乎还在热议着“互联网+”,然而对市场敏感的人就会发现,现在已然成为了“区块链+”的世界。根据百度搜索指数趋势,“区块链”一词的搜索次 ...
2018-03-31
盘点丨2018年最适合学习的编程语言 对于在2018年想学习编程语言的人来说,本篇文章是值得参考的指南。 需要明确的是,这并不是介绍最热门的语言,然后抛出各种名称和流行语。而是根据2018年IT行业现状、趋势 ...
2018-03-30
你的第一个智能合约「Hello World」,好像也不是很智能 在看过我花了 99 个以太坊(Ethereum)来学智能合约开发(http://davidfnck.com/blockchain/ethereum-smart-contract-intro.html/)之后,相信你对以太坊的 ...
2018-03-30【阳光财产保险股份有限公司3】招聘数据分析师 阳光保险集团是国内七大保险集团之一、中国500强企业,由中国石油化工集团公司、中国南方航空集团公司、中国铝业公司、中国外运长航集团有限公司、广东电力发展股份有 ...
2018-03-30【优必爱信息技术(北京)有限公司】招聘数据分析师 低碳化、信息化、智能化是未来汽车技术的发展方向。借助于移动互联网、大数据和云计算等新一代信息技术的革命性突破,智能网联汽车正在改写全球汽车产业格局下的产 ...
2018-03-30【北京信宜明悦咨询有限公司】招聘数据分析师 北京信宜明悦咨询有限公司——企业数据化管理的领跑者。公司成立于2012年3月,专注于推动中国本土成长型企业数据化管理,致力于帮助企业梳理数据资产,分析和挖掘数据价 ...
2018-03-30在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05