cda

数字化人才认证

首页 > 行业图谱 >

画图不装逼,和咸鱼有什么区别,风控中两个看异常分布的图

画图不装逼,和咸鱼有什么区别,风控中两个看异常分布的图
2022-02-17
作者:小伍哥 来源:小伍哥聊风控 今天放假了回家过年了,分享两个看异常分布的图,很好看,也很实用。不会用或者不会画的,随时私聊我。毕竟现在过年也没啥事。 一、箱线图 箱盒图(也称盒图,箱 ...

关于数据分析师的学习路线,这是我见过最全面的

关于数据分析师的学习路线,这是我见过最全面的
2022-01-24
CDA数据分析师 出品 编辑:JYD 对于很多初入数据分析领域的小白来说,往往都会陷入迷茫。数据分析的坑很大,一旦走上这条路,就要明确基本方向,不然只会越走越偏,最后耗费力气,毫无收获。 比如你 ...

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏
2021-12-20
来源:关于数据分析与可视化 01、导入库和读取数据 我们先来大致地看一下数据集中各个特征值的情况,通过info()这个方法 df.info() 02、去除掉缺失值和重复值 要是数据集中存在大量的缺失值, ...

手中无y,心中有y——聚类算法的正确建模方式

手中无y,心中有y——聚类算法的正确建模方式
2021-12-10
CDA数据分析师 出品 作者:CDA教研组 编辑:JYD 聚类算法是属于无监督的机器学习方法;机器学习里把算法分为有监督和无监督的算法,所谓有监督,即我想研究的数据集有目标数据,白话点就是建模里大家 ...

如何避免无效的数据分析结果,这六种错误不可忽视

如何避免无效的数据分析结果,这六种错误不可忽视
2021-12-08
导读:在数据清洗过程中,主要处理的是缺失值、异常值和重复值。所谓清洗,是对数据集通过丢弃、填充、替换、去重等操作,达到去除异常、纠正错误、补足缺失的目的。 作者:宋天龙 本文转自:大数据DT( ...

前瞻:数据科学中的探索性数据分析(DEA)

前瞻:数据科学中的探索性数据分析(DEA)
2021-11-16
CDA数据分析师 出品 作者: tukey 数据科学爱好者知道,在将原始数据输入到机器学习模型之前,需要对其进行大量数据预处理。为此,需要遵循一系列标准来准备数据,具体取决于手头问题的类型(回归或分类 ...

大学读的文科/商科专业,如何转型数据分析师?

大学读的文科/商科专业,如何转型数据分析师?
2021-12-08
互联网和移动互联网时代,程序员成了公认的高薪工作,是众多企业的抢手人才。但凡大学专业沾边计算机的理科生,都有机会去竞逐一下互联网大厂的高薪岗位。 其实文科生已经意识到自己的竞争对手 ...

如何利用 pandas 根据数据类型进行筛选?

如何利用 pandas 根据数据类型进行筛选?
2021-09-24
来源:早起Python 作者:刘早起 前两天,有一位读者在知识星球提出了一个关于 pandas 数据清洗的问题。 他的数据大致如下 现在希望分别做如下清洗 “A列中非字符行B列中非日 ...

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为
2021-09-08
淘宝网,是全球最受欢迎的网购零售平台之一,拥有近5亿的注册用户数,每天有超过6千万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。 分析目标与思路 何判断高价值用户, ...

在R中用箱形图做组间比较

在R中用箱形图做组间比较
2021-09-07
来源:丁点帮你 作者:丁点helper 之前的文章讲了如何用R绘制箱形图,以此来帮助我们了解数据的整体分布情况、是否存在异常值。除此之外,箱形图还可以进行数据的组间比较。 分组变量的数据清理 多重 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)
2021-08-11
不过,在出题前,要公布上一期Level Ⅲ 中51-55题的答案,大家一起来看! 52、C 54、B A、数据正规化 C、数据一般化 57、数据准备方法是在评估模型性能之前对整个数据集进行处理,这会导致数据泄 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)
2021-08-05
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! 42、A 44、B A.会将数据缩放到0-1范围之内 C.作用是将不同量纲数据的量纲进行统一 47.常见的缺失值填充方法有填充默认值 ...

运用Python爬取并分析全国5w+新楼盘近况

运用Python爬取并分析全国5w+新楼盘近况
2021-07-14
作者:云朵君 通过爬取全国城市在售预售新盘,下面以获取单个城市为例,介绍爬取数据部门主要代码。完整代码见文末获取方式。 1、定义函数 2、获取数据的主函数 def get_data(c_city, c ...

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码
2021-07-07
作者:云朵君 本文主要介绍回归模型图lmplot、线性回归图regplot,这两个函数的核心功能很相似,都会绘制数据散点图,并且拟合关于变量x,y之间的回归曲线,同时显示回归的95%置信区间。 所有图形将使 ...

CDA LEVEL II 数据分析认证考试模拟题库(四十六)

CDA LEVEL II 数据分析认证考试模拟题库(四十六)
2021-07-01
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看! 87、B 89、D A.均值加减标准差法 C.聚类法 92、在对数据进行可视化展示的时候合适的图表决定了可视化的效果。下面关于直 ...

CDA LEVEL II 数据分析认证考试模拟题库(十九)

CDA LEVEL II 数据分析认证考试模拟题库(十九)
2024-08-14
不过,在出题前,要公布上一期LEVEL II中86-90题的答案,大家一起来看! 87、C 89、A 你答对了吗? 91.数据清洗包括处理缺失值、异常值、重复值等脏数据,处理每种脏数据的方法也是多种多样。以下哪些 ...

CDA LEVEL II 数据分析认证考试模拟题库(十八)

CDA LEVEL II 数据分析认证考试模拟题库(十八)
2021-05-19
查看更多题目 81、C 83、D 85、A A.ETL过程中的主要环节是数据抽取、数据转换和加工、数据流转 C.常用ETL工具包括datastage,Informatica等 87.下面关于第三范式关系必须符合的条件,说法错误的 ...

CDA LEVEL II 数据分析认证考试模拟题库(七)

CDA LEVEL II 数据分析认证考试模拟题库(七)
2021-04-30
不过,在出题前,要公布上一期LEVEL II中26-30题的答案,大家一起来看! 27、C 29、A 你答对了吗? 31.以下不适合对线性回归模型进行评估的指标是: B.F1 score D.判定系数 A.最小二乘法只适 ...

CDA LEVEL II 数据分析认证考试模拟题库(五)

CDA LEVEL II 数据分析认证考试模拟题库(五)
2021-04-28
不过,在出题前,要公布上一期LEVEL II中6-10题的答案,大家一起来看! 17、A 19、D 你答对了吗? 21.在系统聚类方法中,哪种系统聚类是直接利用了组内的离差平方和? B.重心法 D.类平均法 A ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2024-10-04
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 二、模型构建流程 既然我们机器学习是借助数学模型理解数学,那么最重要的原材料就是数据了。获取数据 ...

OK
客服在线
立即咨询