cda

数字化人才认证

首页 > 行业图谱 >

文本主题模型之潜在语义 索引 (LSI)

文本主题模型之潜在语义索引(LSI)
2017-12-22
文本主题模型之潜在语义索引(LSI) 在文本挖掘中,主题模型是比较特殊的一块,它的思想不同于我们常用的机器学习算法,因此这里我们需要专门来总结文本主题模型的算法。本文关注于潜在语义索引算法(LSI)的原理。 ...

利用解决大数据查找死锁问题 索引 的三种方法

利用解决大数据查找死锁问题索引的三种方法
2017-11-19
利用解决大数据查找死锁问题索引的三种方法 一、主题描述 先看看问题描述:当机房人数达到上限时,评教过程中就遇到了无法提交的情况。遇到问题后大家第一时间发现了是由于死锁造成的。 再来看出现这个问 ...
数据库索引的作用和原理
2017-07-13
数据库索引的作用和原理 数据库索引是为了增加查询速度而对表字段附加的一种标识。很多人机械的理解索引的概念,认为增加索引只有好处没有坏处。其实远不是那样的,这里将其介绍尽量详细些。 首先明白为 ...

数据库 索引 的实现原理

数据库索引的实现原理
2017-02-18
数据库索引的实现原理 一、概述 数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据。索引的实现通常使用B树及其变种B+树。在数据之外,数据库系统还维护着满足特定查 ...

【CDA干货】SQL LEFT JOIN查询耗时过长的成因分析与优化策略研究

【CDA干货】SQL LEFT JOIN查询耗时过长的成因分析与优化策略研究
2026-06-05
在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数据,匹配右表关联数据,无匹配项则自动填充空值,完美适配需要完整保留主表数据、辅助 ...

从“构建数据骨架”到“加速智能取数”:CDA数据分析师视角下的创建表或视图

从“构建数据骨架”到“加速智能取数”:CDA数据分析师视角下的创建表或视图
2026-05-26
 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有什么区别,分别应该在什么业务场景下使用”时,却常常陷入支支吾吾的困境。其实,CURD ...

【CDA干货】MySQL自增ID缺失值统计方法:快速排查断号与数据空洞

【CDA干货】MySQL自增ID缺失值统计方法:快速排查断号与数据空洞
2026-05-22
在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto_increment自增ID默认从1开始依次递增,但在实际业务运行过程中,会因数据删除、事务 ...

CDA持证人专访:王幸谈大数据平台架构与行业解决方案实践

CDA持证人专访:王幸谈大数据平台架构与行业解决方案实践
2026-05-21
【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线分析、分析算法、平台开发、城市人群、开发空间 【专访摘要】本次CDA持证专访邀请到江 ...

【CDA干货】Pandas基于两列计算结果:实操指南与实战案例

【CDA干货】Pandas基于两列计算结果:实操指南与实战案例
2026-05-14
在Python数据分析中,Pandas作为核心工具库,凭借简洁高效的数据处理能力,成为数据分析从业者的必备技能。其中,基于两列(或多列)数据进行计算,是日常数据处理中最高频的操作之一——无论是简单的加减乘除、比例 ...

【CDA干货】SQL数字日期转常规日期详解:从原理到实操,轻松解决日期显示难题

【CDA干货】SQL数字日期转常规日期详解:从原理到实操,轻松解决日期显示难题
2026-04-29
在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师常遇到的格式——这类数字看似直观,却无法直接用于日期筛选、排序、计算(如计算两个 ...

【CDA干货】同一MySQL服务器下两个数据库表数据同步方案详解

【CDA干货】同一MySQL服务器下两个数据库表数据同步方案详解
2026-04-28
在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持同步”的需求。例如,业务系统数据库(biz_db)的用户表数据,需同步至报表统计数据库 ...

【CDA干货】Python ECharts折线图:为每个数据点设置不同属性,让可视化更具表现力

【CDA干货】Python ECharts折线图:为每个数据点设置不同属性,让可视化更具表现力
2026-04-09
在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECharts(以pyecharts为核心实现)作为百度ECharts的Python封装库,凭借丰富的配置项、良 ...

【CDA干货】Python数据处理与图形可视化:核心模块实操指南

【CDA干货】Python数据处理与图形可视化:核心模块实操指南
2026-04-07
在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格式,后者则将抽象的数据规律转化为直观、易懂的图形,两者相辅相成,共同支撑数据分析 ...

CDA数据分析师:企业数据管理方法论的落地者与价值赋能者

CDA数据分析师:企业数据管理方法论的落地者与价值赋能者
2026-04-01
在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方法论,正是释放数据价值、规避管理乱象的关键。企业数据管理方法论以“战略引领、治理 ...

【CDA干货】SQL Server CONVERT日期转换:从基础到实战的全面指南

【CDA干货】SQL Server CONVERT日期转换:从基础到实战的全面指南
2026-03-27
在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务系统中的时间戳转换、数据导入导出,都离不开高效、精准的日期转换方法。CONVERT函数 ...

CDA数据分析师:方差分析与F检验,多组数据差异验证的核心实战方法

CDA数据分析师:方差分析与F检验,多组数据差异验证的核心实战方法
2026-03-24
在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验证不同营销渠道的用户转化率是否存在显著差异、对比多类门店的日均销售额表现、分析不 ...

CDA数据分析师:数据清洗实操指南,筑牢数据分析的质量防线

CDA数据分析师:数据清洗实操指南,筑牢数据分析的质量防线
2026-03-18
“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的准则。原始数据往往裹挟着各类“瑕疵”——缺失的字段、异常的数值、重复的记录、混乱 ...

【CDA干货】Pandas读取dat文件:提取第一行数据并转为数组(实操全指南)

【CDA干货】Pandas读取dat文件:提取第一行数据并转为数组(实操全指南)
2026-03-06
在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领域。很多时候,我们无需读取dat文件的全部数据,仅需快速提取第一行数据(如表头信息、 ...

【CDA干货】MySQL课时排序累加全指南:3种方法+实操案例,新手零失误

【CDA干货】MySQL课时排序累加全指南:3种方法+实操案例,新手零失误
2026-03-05
在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各章节课时得到总课时;按学员学习进度排序,累加已完成课时查看整体学习情况;按授课时 ...

CDA数据分析师必备:用应用效应分解法,解锁时间序列的深层业务价值

CDA数据分析师必备:用应用效应分解法,解锁时间序列的深层业务价值
2026-03-02
在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户活跃量、每月的销量,这些按时间排列的数据背后,隐藏着业务发展的核心规律与驱动因素 ...

OK
客服在线
立即咨询