HDFS 全称为Hadoop Distributed File System,是hadoop分布式文件系统,具体来说,是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。最主要的作用是作为 Hadoop ...
2020-07-17箱型图,又叫做箱线图(Boxplot),或者箱须图(Box-whisker Plot),另外,盒式图指的也是它。箱型图通常是被用作观察数据整体的分布情况,是通过数据中的五个统计量:最小值(上边界)、上四分位数(75/%分位数)、中位 ...
2020-07-17近年来,docker成了最火热、最具颠覆性的科学技术之一,受到了国内、国外许多泛云计算公司、互联网公司、IT大厂的青睐。docker到底是什么?为什么这么火?下面就跟小编一起来看吧! 一、docker概念 让我们先来 ...
2020-07-17柱状图大家都会制作,那么你会用python制作柱状图吗? 我们先来看一下柱状图的定义:柱形图,又被称为长条图、或者柱状统计图,也叫作条图、条状图、棒形图,本质上来说就是一种以长方形的长度为变量的统计图表 ...
2020-07-16图论是什么?关于图的理论?下面跟小编具体来了解一下图论以及简单的图论算法吧。 一、图论起源 18世纪著名古典数学问题之一。在哥尼斯堡的一个公园里,有七座桥将普雷格尔河中两个岛及岛与河岸连接起来(如图) ...
2020-07-16以下文章来源:Python之禅 作者:刘志军 哈哈哈,被自己蠢死了,也被 python 的语法给坑死了。没想到还会遇到这种问题。 事情是这样的。 项目中遇到一个字符串替换的问题。 我们知道字符串替换可以 ...
2020-07-16相信大家都有被要求做报表的时候,而EXCEL就是我们这些数据分析小白常用的报表制作工具。但即使是EXCEL制作出的报表也有很大差别,小编今天就教大家如何绘制出好看的气泡图,来吸引大家的眼球,成为工作汇报的加分 ...
2020-07-16Kudu是由Todd Lipcon@Cloudera带头开发出存储系统,整体应用模式与HBase很相似,也就是能够支持行级别的随机读写,对于批量顺序检索功能也能支持。 一、Kudu的必要性 大家不禁要问了?既然与HBase相似,那为 ...
2020-07-16文章来源: Python猫 作者:豌豆花下猫 zip() 是 Python 中最好用的内置类型之一,它可以接收多个可迭代对象参数,再返回一个迭代器,可以把不同可迭代对象的元素组合起来。 我之前写迭代器系列的时 ...
2020-07-16Series 是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之 相关的数据标签(即索引)组成。 一、对于Series定义的理解 1.Series像是一个Python的dict类型,因为它的索引与元素是映射 ...
2020-07-16NameNode无法启动这个问题,困扰着很多小伙伴,今天小编就来给大家分析一下NameNode无法启动的原因以及解决办法,希望对大家有所帮助。 如果NameNode无法正常启动,建议大家首先去翻看日志,通过日志,查找到无 ...
2020-07-16关于Kafka,相信大家都不陌生,一个消息流的处理平台,目前很多开发人员都把它当做一个生产&消费的中间件。今天小编就跟大家系统介绍一下Kafka,希望对大家有所帮助。 一、Kafka概念 Kafka是一个消息系统, ...
2020-07-16Flume 是 Apache 旗下的一款,开源,可靠性高,扩展性高,管理简单,并且能够支持客户扩展的数据采集系统。 Flume 是使用 JRuby 来构建的,因此依赖于 Java 运行环境。Flume 起初是由 Cloudera 的工程师设计出来, ...
2020-07-16导读:InnoDB是事务安全的MySQL存储引擎,设计上采用了类似于Oracle数据库的架构。通常来说,InnoDB存储引擎是OLTP应用中核心表的首选存储引擎。同时,也正是因为InnoDB的存在,才使MySQL数据库变得更有魅力。 ...
2020-07-16文章转载自:微信公众号Python的乐趣 作者:一粒米饭 比如像电商行业,每月有上百万条订单发货数据需要与仓库的数据进行核对计算,涉及到数据计算,筛选,匹配等步骤,用excel表超级卡,并且经常卡死。 ...
2020-07-16通常情况下javascript是默认同步加载的,也就是所说的javascript的加载时阻塞的,后面的页面要等到javascript加载结束后,才能再进行加载,这样对于一些意义不是很大的javascript来说,如果放在页头会导致加载很慢 ...
2020-07-16相信大家在学习python肯定都听说过python之禅。python之禅到底是个什么东西,设计者为什么要这样设计?又有什么意义呢?看完下面的文章你就会明白了。 文章转载自:微信公众号 Python的乐趣 作者:一粒米饭 ...
2020-07-15数据可视化能够很好地展示我们数据分析的结果,对于平常工作中,一份酷炫的可视化图表也能成为我们在工作汇报时的加分项,可是很多小伙伴对于怎样制作吸引人眼球可视化图表却不知晓,今天小编终于为大家找到了集中 ...
2020-07-15DataFrame是python中pandas库里一种常见的数据框结构,也可以看做是一个矩阵形式,单元格能够存放数值、字符串等,类似于表,也可以当做由Series组成的字典。 DataFrame中包含很多基础函数,很多刚接触到DataFra ...
2020-07-15玫瑰图,全称为南丁格尔玫瑰图(Nightingale rose diagram),或者又叫做鸡冠花图、极坐标区域图等。早在克里米亚战争期间,统计学家和医学改革家佛罗伦斯‧南丁格尔 (Florence Nightingale) 就层使用玫瑰图表传达 ...
2020-07-15数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28ALTER TABLE ADD 多个 INDEX:数据库批量索引优化的高效实践 在数据库运维与性能优化中,索引是提升查询效率的核心手段。当业务 ...
2025-08-27Power BI 去重函数:数据清洗与精准分析的核心工具 在企业数据分析流程中,数据质量直接决定分析结果的可靠性。Power BI 作为主 ...
2025-08-27CDA 数据分析师:数据探索与统计分析的实践与价值 在数字化浪潮席卷各行业的当下,数据已成为企业核心资产,而 CDA(Certif ...
2025-08-27t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22