数据湖或hub的概念最初是由大数据厂商提出的,表面上看,数据都是承载在基于可向外扩展的HDFS廉价存储硬件之上的。但数据量越大,越需要各种不同种类的存储。最终,所有的企业数据都可以被认为是大数据,但并不是 ...
2020-07-07虚拟机是什么?这可能对于没有一定计算机基础的小伙伴很难理解。虚拟机就是虚拟的年脑?其实这样理解也不错。虚拟机是在虚拟硬件上运行的虚拟操作系统(或应用程序环境,如JVM),它的硬盘是在一个文件中虚拟出来的, ...
2020-07-07Hadoop是一种分析和处理大数据的软件平台,是Appach的一个用Java语言所实现的开源软件的加框,可编写和运行分布式应用处理大规模数据,是专为离线和大规模数据分析而设计的,对那种对几个记录随机读写的在线事务处 ...
2020-07-07Linux与windows相比最大的不同就是,很多操作都需要命令来控制。小编整理了一些文件和目录经常会用到的Linux基本命令,希望对各位小伙伴使用Linux有所帮助。 文件和目录 cd /home 进入 \'/ home\' 目录\' ...
2020-07-07RDD 即 Resilient Distributes Dataset, 叫做弹性分布式数据集,是spark中最基础、最常用的数据结构。其本质是把input source 进行封装,封装之后的数据结构就是RDD。RDD具有数据流模型的特点:自动容错、位置感知 ...
2020-07-07SQL语言,是结构化查询语言(StructuredQueryLanguage)的简称。SQL语言是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。下面小编整理了SQL语言的基本语法-增删改查,希望对大家 ...
2020-07-07数据分析是目前最火的行业之一,很多人都想加入,小编今天跟大家分享一些从数据分析就业指导老师那里偷师的求职小技巧,希望能帮助大家成功找到数据分析相关工作。 1. 职位搜索 我们平常搜索求职岗位的 ...
2020-07-07数据清洗是整个数据分析过程的第一步,也是整个数据分析项目中最耗费时间的一步,下面小编整理了几种常用的python数据清洗工具,希望对大家有所帮助。 目前在python中, numpy和pandas是最主流的数据清洗工具,N ...
2020-07-06缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。 python缺失的处理一般情况下有三种方法: (1)删掉缺失值数据 删除法是 ...
2020-07-06在处理数据的过程中,经常会遇到原数据部分内容的缺失,为了保证我们最终数据统计结果的正确性,通常我们有两种处理方式,第一种就是删除掉这些部分缺失的数据;第二种就是填补这些缺失的数据。接下来,我们主要介 ...
2020-07-06numpy是Python中科学计算的基础包。它是一个Python库,提供多维数组对象,各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种API,有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、 ...
2020-07-061、打开python的官网:https://www.python.org/downloads/windows/,选择Downloads,并选择需要的版本。 2、安装 (1)勾选Add PythonXXto PATH是把Python的安装路径添加到系统环境变量的Path变量中 ...
2020-07-06pandas 是 Python 的外部模块,基于NumPy ,是为了解决数据分析任务而创建的,对数据挖掘前期数据的处理工作十分有用。pandas提供了大量能使我们快速便捷地处理数据的函数和方法,而且纳入了大量库和一些标准的数 ...
2020-07-06数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。 在数据分析与挖掘中,我们通常需要根据一些数据建立起特定的模型,然后处理。模型的建立需要 ...
2020-07-06进行商业分析时,自然少不了BI分析工具的应用,小编今天就整理了一些常用的BI分析工具,供大家参考。 1.tableau tableau是目前市面上较为成功的BI分析工具。产品既有针对性,又有普适性。拖放式界面,操作简 ...
2020-07-06说到数据管理和数据可视化工具,往往大家第一个想到的就是tableau。tableau是用来做数据的管理和数据可视化的工具,致力于帮助人们查看并理解自己的数据,可以说是在数据分析工具中最好用的数据管理及可视化软件, ...
2020-07-06powerBI 是微软新一代商业分析工具,用于在组织中提供见解。能够根据filter条件,对数据执行动态筛选,从不同的角度和粒度上分析数据;可连接数百个数据源、简化数据准备并提供即席分析;能够把相关的静态数据转换为 ...
2020-07-06概括地说,泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据对背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为 ...
2020-07-03今天小编给大家带来的是现在非常火爆的机器学习方法——集成学习。集成学习,顾名思义,通过将多个单个学习器集成/组合在一起,使它们共同完成学习任务,有时也被称为“多分类器系统(multi-classifier system)”、 ...
2020-07-03今天我们来盘点一下那些常见的机器学习中的损失函数有哪些。 用于计算损失的函数称为损失函数。模型每一次预测的好坏用损失函数来度量。机器通过损失函数进行学习,如果预测值与实际结果偏离较远,损失函数会得 ...
2020-07-03用 SQL 生成逆向回滚 SQL:数据操作的 “后悔药” 指南 在数据库操作中,误删数据、错改字段或误执行批量更新等问题时有发生。 ...
2025-07-14如何考取数据分析师证书:以 CDA 为例 在数字化浪潮席卷各行各业的当下,数据分析师已然成为企业挖掘数据价值、驱动决策的 ...
2025-07-14t检验与Wilcoxon检验的选择:何时用t.test,何时用wilcox.test? t 检验与 Wilcoxon 检验的选择:何时用 t.test,何时用 wilcox. ...
2025-07-14AI 浪潮下的生存与进阶: CDA数据分析师—开启新时代职业生涯的钥匙(深度研究报告、发展指导白皮书) 发布机构:CDA数据科 ...
2025-07-13LSTM 模型输入长度选择技巧:提升序列建模效能的关键 在循环神经网络(RNN)家族中,长短期记忆网络(LSTM)凭借其解决长序列 ...
2025-07-11CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-11数据透视表中两列相乘合计的实用指南 在数据分析的日常工作中,数据透视表凭借其强大的数据汇总和分析功能,成为了 Excel 用户 ...
2025-07-11尊敬的考生: 您好! 我们诚挚通知您,CDA Level I和 Level II考试大纲将于 2025年7月25日 实施重大更新。 此次更新旨在确保认 ...
2025-07-10BI 大数据分析师:连接数据与业务的价值转化者 在大数据与商业智能(Business Intelligence,简称 BI)深度融合的时代,BI ...
2025-07-10SQL 在预测分析中的应用:从数据查询到趋势预判 在数据驱动决策的时代,预测分析作为挖掘数据潜在价值的核心手段,正被广泛 ...
2025-07-10数据查询结束后:分析师的收尾工作与价值深化 在数据分析的全流程中,“query end”(查询结束)并非工作的终点,而是将数 ...
2025-07-10CDA 数据分析师考试:从报考到取证的全攻略 在数字经济蓬勃发展的今天,数据分析师已成为各行业争抢的核心人才,而 CDA(Certi ...
2025-07-09【CDA干货】单样本趋势性检验:捕捉数据背后的时间轨迹 在数据分析的版图中,单样本趋势性检验如同一位耐心的侦探,专注于从单 ...
2025-07-09year_month数据类型:时间维度的精准切片 在数据的世界里,时间是最不可或缺的维度之一,而year_month数据类型就像一把精准 ...
2025-07-09CDA 备考干货:Python 在数据分析中的核心应用与实战技巧 在 CDA 数据分析师认证考试中,Python 作为数据处理与分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的有力工具 在数据分析的广袤领域中,准确捕捉数据的趋势变化以及识别 ...
2025-07-08备战 CDA 数据分析师考试:需要多久?如何规划? CDA(Certified Data Analyst)数据分析师认证作为国内权威的数据分析能力认证 ...
2025-07-08LSTM 输出不确定的成因、影响与应对策略 长短期记忆网络(LSTM)作为循环神经网络(RNN)的一种变体,凭借独特的门控机制,在 ...
2025-07-07统计学方法在市场调研数据中的深度应用 市场调研是企业洞察市场动态、了解消费者需求的重要途径,而统计学方法则是市场调研数 ...
2025-07-07CDA数据分析师证书考试全攻略 在数字化浪潮席卷全球的当下,数据已成为企业决策、行业发展的核心驱动力,数据分析师也因此成为 ...
2025-07-07