大数据时代最该关心的事儿-CDA数据分析师官网

请问pycharm运行程序出现Using tensorflow backend是怎么回事？

当你在PyCharm中运行一个使用TensorFlow的Python程序时，有时会看到一条消息"Using TensorFlow backend"。这是因为在程序中使用了Keras库，而Keras默认使用TensorFlow作为后端引擎。这条消息实际上只是告诉你当前 ...

2023-04-10

如何用BP神经网络做时间序列预测?

BP神经网络是一种常见的人工神经网络，可以用于时间序列预测。时间序列预测是指根据历史数据对未来的趋势进行预测，这在商业、金融和天气预报等领域非常有用。在本文中，我将介绍如何使用BP神经网络进行时间序列预测 ...

2023-04-10

用xgboost做分类，预测结果输出的为什么不是类别概率？

XGBoost是一种基于决策树的集成学习算法，在分类问题中通常被用来预测二元或多元分类结果。与传统的决策树相比，XGBoost具有更优秀的准确性和效率。然而，在使用XGBoost进行分类时，其输出通常不是类别概率， ...

2023-04-10

神经网络进行数据预测的原理是什么？

神经网络是一种基于人工神经元网络的计算模型，被广泛应用于数据预测和其他机器学习任务中。在数据预测方面，神经网络的原理是利用已知数据集来训练模型，然后使用该模型来进行未知数据的预测。神经网络的基本结构 ...

2023-04-10

SPSS降维里的因子得分能作为变数作回归分析吗？

在SPSS中，降维是指将高维度数据集转换为低维度数据集的过程。这可以通过因子分析等技术实现。当使用因子分析时，通常会生成一组称为因子得分的新变量。因子得分是观察值在每个因子上的得分，从而在减少原始变量数量 ...

2023-04-10

神经网络的收敛速度和梯度大小有关吗？

神经网络的收敛速度和梯度大小有密切关系。在神经网络训练过程中，我们通常会使用反向传播算法来计算每个权重的梯度，然后根据这些梯度来更新权重。因此，梯度大小对于神经网络的学习效率和收敛速度是至关重要的。 ...

2023-04-10

在 Pandas DataFrame 中如何归一化某列？

Pandas是一种用于数据分析和处理的常用Python库。在Pandas DataFrame中，归一化某列可以将该列的值从原始比例缩放到0到1之间的标准比例，使其更容易与其他列进行比较和分析。本文将介绍如何对Pandas DataFrame中的某 ...

2023-04-10

Linux页表中虚拟内存地址如何映射到硬盘数据块地址?

Linux是一种流行的操作系统，其在内存管理方面采用了虚拟内存技术。虚拟内存是一种将物理内存和硬盘空间结合起来使用的技术，在Linux中，这个过程是由页表来实现的。页表是一个数据结构，它将虚拟地址映射到物理地 ...

2023-04-10

卷积神经网络图像处理卷积时，为啥要旋转180°？

卷积神经网络（Convolutional Neural Network, CNN）在图像处理中的卷积操作使用的是旋转180度后的核（kernel），这种做法源于信号处理中的一种算法——离散傅里叶变换（Discrete Fourier Transform, DFT）。在本文 ...

2023-04-10

如何计算决策树的各特征重要程度？

决策树是一种常用的机器学习算法，它可以对数据进行分类和预测。在决策树中，特征（或属性）重要性是指每个特征对模型准确性的贡献程度。因此，了解如何计算特征重要性是非常有用的，可以帮助我们选择最相关的特征 ...

2023-04-07

为什么NLP模型训练1~3个epoch就可以收敛，但是CV模型很多需要训练十几甚至上百个epoch？

NLP和CV都是机器学习领域中的重要分支，但在训练模型时存在一些差异。NLP模型通常只需1~3个epoch就可以达到收敛，而CV模型则需要更多的epoch才能收敛。这种差异主要是因为两者处理数据的方式不同。首先，NLP模 ...

2023-04-07

LSTM 中为什么要用 tanh 激活函数？tanh 激活函数的作用及优势在哪里？

LSTM是一种常用的循环神经网络架构，它可以有效地解决传统RNN中长序列训练过程中产生的梯度消失和梯度爆炸问题。LSTM通过使用门控机制来控制信息的流动，其中tanh激活函数扮演了重要角色。 tanh激活函数是一种 ...

2023-04-07

MySQL时间字段究竟使用INT还是DateTime型?

MySQL是一种流行的关系型数据库，用于存储和管理各种类型的数据。当涉及到使用日期和时间相关的信息时，开发人员必须决定如何在MySQL中存储这些信息。常见的做法是将日期和时间信息存储为INT或DateTime类型。 ...

2023-04-07

PyTorch中的扩张卷积（空洞卷积）是怎么实现的？

扩张卷积，也被称为空洞卷积，是一种在深度学习中常用的卷积操作，可以有效地增加模型感受野和步幅，同时减少参数数量。在PyTorch中，扩张卷积是通过使用nn.Conv2d()函数来实现的。该函数有四个必填参数：in_channe ...

2023-04-07

当tensorflow模型超过单张显卡显存的时候，应该怎么拆分到多个GPU上运行？

在深度学习模型训练过程中，往往需要处理大量的数据和参数，进而需要较大的计算资源支持。然而，单张显卡的显存有限，当模型过于复杂或者数据集过于庞大时，会导致无法将整个模型同时加载到显存中进行训练。为了充 ...

2023-04-07

相比Tensorflow2和PyTorch，TensorFlow1.x版本有什么弊端？

TensorFlow 1.x版本是Google发布的第一个深度学习框架，它在2015年推出后，迅速成为了业界最受欢迎的深度学习框架之一。然而，TensorFlow 1.x版本也存在一些弊端，这些弊端在TensorFlow 2.0和PyTorch等新一代深度学 ...

2023-04-07

Linux Namespace 是什么，可以用来做什么？

Linux Namespace 是 Linux 操作系统中的一种隔离机制，可以用来创建独立的用户空间，使得不同进程之间的资源隔离和沙箱化成为可能。在一个 Namespace 中，进程可以看到自己所处的环境，但是不能访问其它 Namespace ...

2023-04-07

如何理解MySQL中间隙锁可以避免幻读的问题？

MySQL的中间隙锁是指在使用索引进行范围查询时，对于被查询的索引键范围之外的“空隙”部分也会被加锁，以避免幻读的问题。幻读（Phantom Read）是指在一个事务中多次执行同样的查询语句，但是每次查询结果都不同， ...

2023-04-07

请问如何解决神经网络训练集和验证集的loss、acc差别过大的问题？

在神经网络的训练过程中，我们通常会把数据集划分为训练集和验证集。训练集用于训练模型，而验证集则用于评估模型的性能。在实际操作中，有时候我们会遇到训练集和验证集的损失(loss)、准确率(acc)差别过大的情况 ...

2023-04-07

pytorch怎么计算矩阵的相关系数矩阵？

在PyTorch中，计算矩阵的相关系数矩阵可以使用torch.corrcoef()函数。该函数接受一个张量作为输入，返回该张量的行之间的相关系数矩阵。如果输入张量是二维的，则计算其中每一列之间的相关系数矩阵。下面我们将详 ...

2023-04-07

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】Excel透视表进阶：两个字段相乘的完整实 ...

【CDA干货】DBeaver实现UAT到SIT表数据同步（同表结 ...

CDA数据分析师：统计制图（数据可视化）实战指南— ...

【CDA干货】层次回归分析：变量是否需要标准化？— ...

【CDA干货】SQL实时表实现解析：从技术原理到落地实 ...

CDA数据分析师：数据分析基础范式的践行者与价值放 ...

【CDA干货】成分得分系数矩阵与载荷矩阵：不是同一 ...

【CDA干货】大数据应用的行业密码：不同企业的实践 ...

CDA 数据分析师：从数据分析基本概念到实战落地 — ...

【CDA干货】金融统计实战案例：银行个人信贷违约预 ...

【CDA干货】mtcars 数据集的实战

CDA 数据分析师：企业数据需求与数据分析需求的精准 ...

【CDA干货】大模型每层神经元个数怎么定？从原理到 ...

【CDA干货】购买决策推动力分析

CDA 数据分析师：企业数字化转型的核心引擎 —— 从 ...

【CDA干货】用模型挖掘数据中的隐性特征：方法、案 ...

【CDA干货】大模型结果稳定性方法论：从输入到落地 ...

CDA 数据分析师：企业数据安全管理方法论落地指南 ...

【CDA干货】机器学习分类模型：从原理到实战的完整 ...

【CDA干货】交叉频数分布：分类变量的关联放大镜， ...