不平衡学习算法的评估指标 先来看下类不平衡的定义:对于二元分类问题,存在类别分布不平衡的问题,即某一类别的样本数量远远多于另一类(分别称为多数类和少数类)。具有这样特征的二元分类数据集被称为不平衡 ...
2018-04-05教你用Python实现简单监督学习算法 监督学习作为运用最广泛的机器学习方法,一直以来都是从数据挖掘信息的重要手段。即便是在无监督学习兴起的近日,监督学习也依旧是入门机器学习的钥匙。 这篇监督学习教程 ...
2018-04-05大数据杀熟:无关技术,关乎伦理 同样的商品或服务,老客户看到的价格反而比新客户要贵出许多,这在互联网行业被叫作“大数据杀熟”。调查发现,在机票、酒店、电影、电商、出行等多个价格有波动的平台都存在 ...
2018-04-05大数据时代对思维方式的改造 大数据将对整个社会的全面发展带来全新的动力。作为一种伟大的革命性动力,大数据的运行及其作用的发挥,需要我们做好各方面的准备,而这其中的一个关键,是与社会体制变革相适应的 ...
2018-04-05Python中关于Sequence切片的下标问题详解 在python中, 切片是一个经常会使用到的语法, 不管是元组, 列表还是字符串, 一般语法就是: sequence[ilow:ihigh:step] # ihigh,step 可为空; 为了简短易懂, 暂时排除 ...
2018-04-05金融大数据分析的数据分流应用 随着金融大数据技术应用,以及相关业务大数据应用不断创新,金融机构的数据分析和业务创新,以及数据安全如何深度融合,是当前金融机构信息化面临的重要挑战。 银监会印发《银 ...
2018-04-05【万方数据股份有限公司】招聘数据分析师 万方数据股份有限公司是国内较早一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。经过十 ...
2018-04-04【天津市发健食品有限公司】招聘数据分析师 “吉健炸香鸡”隶属于天津市发健食品有限公司,自1998年创立以来,专注于炸香鸡产品的研发、传播及推广,立足天津面向全国,开展全国连锁事业,坚持把产品质量和品牌美誉 ...
2018-04-04【南京市栖霞区铃之鑫汽车配件经营部】招聘数据分析师 公司创建于2001年,属股份制企业,中国汽车工业协会成员单位,中国汽车协会车身附件委员会理事单位,江苏省汽车工业协会常务理事单位,南京市汽车工业协会成员 ...
2018-04-04中国婚姻大数据告诉你,为什么近10年初婚的人越来越少 为此,腾讯信息可视化实验室从国家统计局收集了中国2007-2016年婚姻服务数据,分析发现以下几个特点: 1、近10年结婚的人越来越少,离婚的人越来越多 ...
2018-04-04小姐姐带你一起学:如何用Python实现7种机器学习算法(附代码) Python 被称为是最接近 AI 的语言。最近一位名叫Anna-Lena Popkes的小姐姐在GitHub上分享了自己如何使用Python(3.6及以上版本)实现7种机器学 ...
2018-04-04python中的list和array的不同之处 python中的list是python的内置数据类型,list中的数据类不必相同的,而array的中的类型必须全部相同。 在list中的数据类型保存的是数据的存放的地址,简单的说就是指 ...
2018-04-04Python切片操作实例分析 本文实例讲述了Python切片操作。分享给大家供大家参考,具体如下: 在很多编程语言中,针对字符串提供了截取函数,其实目的就是对字符串切片。Python没有针对字符串的截取函数,只需要 ...
2018-04-04新手如何快速入门深度学习 深度学习必备基础 深度学习发展至今已然有几个年头了,上个世纪九十年代的美国银行率先使用深度学习技术做为手写字体识别,但深度学习的惊艳登场并没有留住它一时的辉煌, 直到20 ...
2018-04-04大数据的应用价值 在于预测未来 大数据中心的建设,为的是后期对数据的挖掘应用。大数据应用在全球各国发酵之际,伴随而来的是各国普遍缺乏数据科学家问题。应大数据处理的需求,无论企业决定采用哪一种解决方 ...
2018-04-04大数据行业服务商 挖掘金矿里的金矿 比金融更懂金融,比电信更懂电信,比交通更懂交通——比行业用户更懂行业的,莫过于为他们长年提供IT解决方案、技术及业务应用支撑的专业服务商了。 多数金融IT企业 ...
2018-04-04python 切片和range()用法说明 理解切片基本用法: 首先需要明白,可迭代对象,按照正数索引(正序)是从0开始的,按照负数索引(逆序)是从-1开始的。 >>> astring = \'Hello world\' >>> astring[0:2] \' ...
2018-04-04大数据比云计算更为落地 大连接,大交互,才有大数据。“大数据时代的到来,除了数据量的增加之外,非结构化和半结构化数据的爆炸增长,数据结构日趋复杂,目前我们使用的工具和技术、信息系统和数据库建设还难 ...
2018-04-04python访问类中docstring注释的实现方法 本文实例讲述了python访问类中docstring注释的实现方法。分享给大家供大家参考。具体分析如下: python的类注释是可以通过代码访问的,这样非常利于书写说明文档 class ...
2018-04-04数据挖掘的客户知识管理模型研 随着经济全球化和科技信息技术的快速发展。世界进入了一个崭新的知识经济时代。企业所处的竞争环境发生了深刻的变化,原有的市场开始衰落、竞争对手成倍增长、新技术突飞猛进、产 ...
2018-04-04在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19