python清理数据领域的知识。 lambda 表达式是一个匿名函数,lambda表达式基于数学中的λ演算得名,直接对应于其中的lambda抽象,是一个匿名函数,即没有函数名的函数。 lambda表达式可以接受任意数量的参数 ...
2020-05-09
相信接触过Excel的小伙伴都知道,Excel有一个非常强大的功能“数据透视表”,使用数据透视表可以自由选择不同字段,用不同的聚合函数进行汇总,并建立交叉表格,用以从不同层面观察数据。这么强大的功能,在Python ...
2020-05-09
一般大家在学习python机器学习的时候,用的最多的可视化的包就是matplot和seaborn, 这2个可视化的优点在于门槛低,代码容易理解,并且容易上手。唯一的可能的缺点就是画出来的图不能交互,简单来说就是matplot和se ...
2020-05-09
很多企业在营销的时候会提到“用户画像”,那用户画像究竟是什么呢? 其实用户画像就是用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出 ...
2020-05-09
矩阵分析、矩阵理论、矩阵论是三种较为常见学科,这里为大家介绍一些它们的适用范围和区别。 ——矩阵分析 主要包括线性空间与线性变换,内积空间,矩阵的相似标准形,矩阵分解,矩阵函数等内容, ...
2020-05-08
近几年,数据的增长速度呈现爆炸式趋势,数据营利成为或将成为收入的主要来源。大部分的商业智能应用均针对营销决策,在这一领域的主要影响如下。 (1)、规划分析 数据科学家为营销部门提供了对客户行为 ...
2020-05-08
BI分析几年来越来越流行,我们从最简单的概念BI入手,来诠释出BI分析就是什么? BI,英文全称为:Business Intelligence,中文翻译为商业智能。这个概念最早在1996年提出。当时将商业智能定义为一类由数 ...
2020-05-08
1984年,Light等提出了漏斗图,一般以单个研究的效应量为横坐标,样本含量为纵坐标做的散点图。效应量可以为RR、OR和死亡比或者其对数值等。理论上讲,被纳入Meta分析的各独立研究效应的点估计,在平面坐 ...
2020-05-08
Tableau是一款帮助人们查看并理解数据的软件,拥有强大、安全且灵活的端到端数据分析negligible,可以助力任何人快速分析、可视化并分享信息。在百度百科中显示,目前已有超过42,000家客户通过使用Tableau在 ...
2020-05-07
如今的维度分析方式越来越受大众的欢迎,无论是在数据分析领域,还是学习生活方面,它都能显现出闪光点。 首先,维度分析是一个比较大的范畴,涵盖的方面很多,比如一个主题的多方面,也可以是多个主体 ...
2020-05-07
R语言dplyr包主要用于数据清洗和整理,主要功能有:行选择、列选择、统计汇总、窗口函数、数据框交集等是非常高效、友好的数据处理包,学清楚了,基本上数据能随意玩弄,对的,随意玩弄,简直大大提高数据处理及分 ...
2020-05-07
随着人工智能的飞速发展,机器学习成为当下数据分析领域的热门之一,很多人在平时的工作中,或多或少都会使用到机器学习的算法。这里机器学习的算法进行了盘点,将有监督、无监督,半监督学习等进行了简单的解 ...
2020-05-06
网上找到的有关python语音识别的例子,有一些成熟的模型,可以进行python语音识别,将语音转成文字。例如Cloud Speech API,但是需要你使用google云平台的前提。下面我们一起来看看吧! ...
2020-05-06
内置示例数据集 seaborn内置了十几个示例数据集,通过load_dataset函数可以调用。 其中包括常见的泰坦尼克、鸢尾花等经典数据集。 #查看数据集种类 importseabornassns sn ...
2020-04-28
首先先看一下效果: 一、创建饼状图对象 创建饼状图对象用到类是PieChartView.h, 代码如下: self.pieChartView = [[PieChartView alloc] init]; self.pieChartVi ...
2020-04-28
把这三个包放在一起有几个原因:首先 Seaborn 和 Pandas 是建立在 Matplotlib 之上的,当你在用 Seaborn 或 Pandas 中的 df.plot() 时,用的其实是别人用 Matplotlib 写的代码。因此,这些图在美化方面是 ...
2020-04-28
CDA数据分析师 出品 近日,新冠肺炎防控成果的好消息不断。 今天我们聊聊,惊艳的疫情直观图。 据国家卫健委数据统计, 截止至3月10日24时,31省区市累计治愈出院病历超6 ...
2020-04-28
条形图,应该也是大家非常熟悉的一种图表了。 条形图的识别度极高,用它来视觉化地传达具体数字背后的意义,干净又利落,复杂的数据到了这里,顿时变得一目了然。 现在就让 ...
2020-04-22
今天给大家分享一下如何画出漂亮的箱线图。首先,我们最简单工具画箱线图就是EXCEL,那么我们先介绍一下用EXCEL来画一下。 选中数据,然后点击下插入,选择图表,找到箱线图 ...
2020-04-22
想画SNP标记在不同的染色体的分布密度,但是不知道用什么软件画出来的?说不定在论坛发个贴就能解决你的困扰哦~ 这不,有网友发个贴提问,就有码农分享自己的代码了。小编把代码也贴出来给大家瞄 ...
2020-04-22主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01