大数据时代最该关心的事儿-CDA数据分析师官网

前馈神经网络基本原理是什么？

前馈神经网络可以算是所有的神经网络中最简单，最容易，但也是最有效的一个。但对于刚刚入门的小白来说，难度还是比较大的。到底前馈神经网络是如何实现的，下面就和小编一起来看推到过程吧。如上图中所 ...

2020-07-13

NLP自然语言处理基础概念的理解与介绍

NLP(Natural Language Processing)自然语言处理是数据科学领域的一个非常重要的分支，它包含了，以一种高效的方式去分析，理解并从文本中提取信息等重要过程，终极目标是让计算机拥有自然语言处理交际能力。通过利 ...

2020-07-13

如何快速简单地入门Keras？

Keras 是基于 Theano 或者TensorFlow 的一个深度学习框架，其设计源于Torch，编程语言用 Python ，是一个功能强大、内容抽象，高度模块化的神经网络库，能够支持 GPU 和 CPU。目前tensorflow已经将keras合并到了 ...

2020-07-13

K-means聚类算法的原理是什么？具体操作步骤有哪些？

K-means是最常用、最简单的一种聚类算法。k-means聚类，就是将原始数据所含的类数事先给出来，然后将含有相似特征的数据聚为一个类中。一、K-means聚类算法原理在聚类问题中，给我们的训练样本是.每个.没 ...

2020-07-13

终于有人把数据科学、机器学习和人工智能讲明白了

作者：Alex Castrounis 来源：大数据DT(ID：hzdashuju) 内容摘编自《AI战略：更好的人类体验与企业成功框架》导读：本文讨论与人工智能相关的概念和技术，包括机器学习、深度学习、数据科学和大数据。还 ...

2020-07-10

机器学习中感知机是什么？如何实现？

感知机(Perceptron)或者叫做感知器，是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络，是机器学习领域最基础的模型，被誉为机器学习的敲门砖。 ...

2020-07-10

如何清晰的理解Z-Score这种数据标准化的处理方法？

Z-Score是数据标准化处理的一种常用方法，通过Z-Score，可以将不同量级的数据转化为统一量度的Z-Score分值，并进行比较。 (1)Z-score定义根据图可以看出，Z-score的数据分布满足“正态分布”(N(0.1)) ...

2020-07-10

关系型数据库与非关系型数据库的不同表现在什么地方？

小编今天来给大家盘点一下关系型数据库与非关系型数据库的区别。一、概念关系型数据库，是指采用了关系模型来组织数据的数据库。非关系型数据库从严格上来说，并不是一种数据库，而是一种数据结构化存 ...

2020-07-10

常见的关系型数据库最全整理

关系型数据库，是指采用了关系模型来组织数据的数据库。简单来理解就是，二维数据库，一个由二维表及其之间的联系而组成的一个数据组织。关系型数据库并不是唯一的高级数据库模型，也不算是性能最优的数据库模 ...

2020-07-10

分布式存储的优点有哪些？

分布式存储，采用分布式的系统结构，将大量的普通服务器，通过网络互联，作为一个整体，利用位置服务器定位存储信息。 1.高可靠性：重点指分布式系统数据安全方面的容灾与备份，数据可靠不丢失。在分布式存储的 ...

2020-07-10

这几种分布式计算框架，你必须知道！

对于大数据的处理问题，计算机科学界有两大方向：一是集中式计算，另外一种是分布式计算。小编今天给大家整理的是几种主流的分布式计算框架，希望对大家有所帮助。 Hadoop是基础，它的HDFS能够存储文件，Yarn进 ...

2020-07-10

你真的了解正则表达式吗？

正则表达式(Regular Expression)，计算机科学的一个概念，又叫做正规表示法或者常规表示法。正则表达式描述了一种字符串匹配的模式，能够检查一个串中是不是含有某种子串、替换匹配的子串，将符合某个条件的子 ...

2020-07-10

干活的干不过写PPT的？或许只是工作汇报的方式错了……

还记得那首火爆全网，根据沙漠骆驼改编的大胆神曲《释放自我》吗? 当时可谓掀起了巨浪，其歌词精炼，一针见血，令人印象最深刻的是“干活的累死累活，有成果那又如何，到头来干不过写PPT的”。歌词 ...

2020-07-09

OpenCV入门及应用案例：手把手教你做DNN图像分类

作者：吴至文郭叶军宗炜李鹏赵娟来源：大数据DT(ID：hzdashuju) 内容摘编自《OpenCV深度学习应用与性能优化实践》导读：本文将介绍OpenCV的源码结构、OpenCV深度学习应用的典型流程，以及深度学习 ...

2020-07-09

python数据分析常用的库有哪几种？

1、Numpy NumPy 是一个 Python 包。它代表 “Numeric Python”。它是一个由多维数组对象和用于处理数组的例程集合组成的库。它是Python创建的所有更高层工具的基础。以下是它提供的一些功能： a、N维数组 ...

2020-07-09

计算机视觉--图像的基础知识

计算机视觉是一门研究如何让计算机“看”的学科。简单来说，就是指利用摄影机和电脑等机器，来代替人眼对目标进行识别、跟踪以及测量等，并进一步对图形进行处理，使之成为更适合人眼观察或传送、检测的图像。 ...

2020-07-09

图像上采样常用的插值方法有哪些？

上采样（upsampling）或图像插值（interpolating）的主要目的是将源图像放大，从而能够更高分辨率的显示设备上显示。上采样的原理：上采样（upsampling），图像放大几乎都是采用内插值方法，即在原有 ...

2020-07-09

不平衡数据处理常用方法--下采样

机器学习中，当原始数据的分类极不均衡，需要对不平衡数据进行处理，而下采样就是处理方法之一。简单来说就是从多数类中随机抽取样本从而减少多数类样本的数量，使数据达到平衡。下采样，通常适用于 ...

2020-07-09

梯度提升决策树到底是一种怎样的算法？

梯度提升决策树(GBDT)，全称为Gradient Boosting Decision Tree，是一种迭代的决策树算法，由多棵决策树组成，将所有树的结论累加起来，产出最终答案。这也就意味着在GBDT中，CART决策树为基学习器，也就是每 ...

2020-07-09

决策树剪枝，常用这2种方法

前面我们了解了决策树的概念，现在来了解一下决策树剪枝。可能会有人问：为什么要剪枝?答案是：如果一棵决策树完全生长，那么这棵决策树所对应的每一个叶节点中只会包含一个样本，就很有可能面临过拟合问题，因此 ...

2020-07-09

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】Excel透视表进阶：两个字段相乘的完整实 ...

【CDA干货】DBeaver实现UAT到SIT表数据同步（同表结 ...

CDA数据分析师：统计制图（数据可视化）实战指南— ...

【CDA干货】层次回归分析：变量是否需要标准化？— ...

【CDA干货】SQL实时表实现解析：从技术原理到落地实 ...

CDA数据分析师：数据分析基础范式的践行者与价值放 ...

【CDA干货】成分得分系数矩阵与载荷矩阵：不是同一 ...

【CDA干货】大数据应用的行业密码：不同企业的实践 ...

CDA 数据分析师：从数据分析基本概念到实战落地 — ...

【CDA干货】金融统计实战案例：银行个人信贷违约预 ...

【CDA干货】mtcars 数据集的实战

CDA 数据分析师：企业数据需求与数据分析需求的精准 ...

【CDA干货】大模型每层神经元个数怎么定？从原理到 ...

【CDA干货】购买决策推动力分析

CDA 数据分析师：企业数字化转型的核心引擎 —— 从 ...

【CDA干货】用模型挖掘数据中的隐性特征：方法、案 ...

【CDA干货】大模型结果稳定性方法论：从输入到落地 ...

CDA 数据分析师：企业数据安全管理方法论落地指南 ...

【CDA干货】机器学习分类模型：从原理到实战的完整 ...

【CDA干货】交叉频数分布：分类变量的关联放大镜， ...