不平衡数据分类算法介绍与比较 在数据挖掘中,经常会存在不平衡数据的分类问题,比如在异常监控预测中,由于异常就大多数情况下都不会出现,因此想要达到良好的识别效果普通的分类算法还远远不够,这里介绍几 ...
2018-04-01机器学习中的数据不平衡解决方案大全 在机器学习任务中,我们经常会遇到这种困扰:数据不平衡问题。 数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统 ...
2018-04-01我们应以何种思维方式来适应大数据时代 目前,在报刊文献和各种媒体中,大数据这个概念,几乎是处处可见、不绝于耳;同时,学术界的学术研究,使人们对大数据的理性认识水平不断提高。有学者认为,2012年世界 ...
2018-04-01【北京凯因科技股份有限公司】招聘数据分析师 北京凯因科技股份有限公司(以下简称凯因科技)成立于2008年,注册资本11500万元。位于素有“药谷”之称的北京经济技术开发区。凯因科技以生物技术为平台,专注于肝病领 ...
2018-03-31【成都名文建筑装饰设计有限公司】招聘数据分析师 名文建筑装饰公司是集室内设计、开发、预算、施工、材料于一体的专业化设计公司。公司从专业的设计和可实现性的角度上,为客户营造更温馨和舒适的家园。 职位月薪 ...
2018-03-31【国电南瑞轨道交通技术分公司】招聘数据分析师 轨道交通技术分公司作为国家电网公司直属产业单位南瑞集团公司旗下上市公司—国电南瑞科技股份有限公司的下属分公司之一,是国内唯一同时掌握城市轨道交通电力自动化 ...
2018-03-31Python栈算法的实现与简单应用示例 本文实例讲述了Python栈算法的实现与简单应用。分享给大家供大家参考,具体如下: 原理: 栈作为一种数据结构,是一种只能在一端进行插入和删除操作。它按照先进后出的 ...
2018-03-31Python with语句上下文管理器两种实现方法分析 本文实例讲述了Python with语句上下文管理器。分享给大家供大家参考,具体如下: 在编程中会经常碰到这种情况:有一个特殊的语句块,在执行这个语句块之前需 ...
2018-03-31深入解析Python中的上下文管理器 Python中把进入代码块前调用__enter__ 方法并在离开代码块后调用__exit__方法的对象作为上下文管理器,本文中我们就来深入解析Python中的上下文管理器,来看看上下文管理器的作用 ...
2018-03-31机器学习4种不同数据集的优劣对比 数据源决定了机器学习算法,机器算法的选择好坏也决定了数据的分析质量等,因此,我们选择机器算法的时候,要首先弄懂各个机器学习数据集的优劣性,主要特点,方可着手处理, ...
2018-03-31浅谈数据分析中的“暗物质” 我们分析数据,更重要的是看到数据中所隐藏的暗物质,即数据图中你看不见的数据\\逻辑\\知识。 开门见山,以下是某新闻媒体WAP\\APP\\PC三端的分周中和周末的PV曲 ...
2018-03-31机器学习中的数据集合 数据集分类 在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train set) 验证集(validation set) 测试集(test set)。 训练集用来估计模型,验证集用来确定网络结构或 ...
2018-03-31移动大数据的四个发展趋势 如果我告诉你,你可以做到从海量数据来源(包括各种各样的移动设备)中把数据提取到一个系统,然后只用少量的程序行数描述所需的信息就可以让结果轻松呈现,还可以做到实时处理这些数 ...
2018-03-31最流行的4个机器学习数据集 机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很重要。本文作为学习研究数 ...
2018-03-31区块链火热应用场景成关键 业内:今年是落地好时机 数个月前,人们似乎还在热议着“互联网+”,然而对市场敏感的人就会发现,现在已然成为了“区块链+”的世界。根据百度搜索指数趋势,“区块链”一词的搜索次 ...
2018-03-31盘点丨2018年最适合学习的编程语言 对于在2018年想学习编程语言的人来说,本篇文章是值得参考的指南。 需要明确的是,这并不是介绍最热门的语言,然后抛出各种名称和流行语。而是根据2018年IT行业现状、趋势 ...
2018-03-30你的第一个智能合约「Hello World」,好像也不是很智能 在看过我花了 99 个以太坊(Ethereum)来学智能合约开发(http://davidfnck.com/blockchain/ethereum-smart-contract-intro.html/)之后,相信你对以太坊的 ...
2018-03-30【阳光财产保险股份有限公司3】招聘数据分析师 阳光保险集团是国内七大保险集团之一、中国500强企业,由中国石油化工集团公司、中国南方航空集团公司、中国铝业公司、中国外运长航集团有限公司、广东电力发展股份有 ...
2018-03-30【优必爱信息技术(北京)有限公司】招聘数据分析师 低碳化、信息化、智能化是未来汽车技术的发展方向。借助于移动互联网、大数据和云计算等新一代信息技术的革命性突破,智能网联汽车正在改写全球汽车产业格局下的产 ...
2018-03-30【北京信宜明悦咨询有限公司】招聘数据分析师 北京信宜明悦咨询有限公司——企业数据化管理的领跑者。公司成立于2012年3月,专注于推动中国本土成长型企业数据化管理,致力于帮助企业梳理数据资产,分析和挖掘数据价 ...
2018-03-30在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19