
数据结构与算法之排序
堆排序、快速排序、希尔排序、直接选择排序不是稳定的排序算法,而基数排序、冒泡排序、直接插入排序、折半插入排序、链表插入排序、归并排序是稳定的排序算法。
直接插入排序 T(n) = O(n^2)
直接插入排序「Insertion Sort」的基本思想是:每次将一个待排序的记录,按其关键字大小插入到前面已经排好序的子序列中的适当位置,直到全部记录插入完成为止。
设数组为a[0…n-1]:
1. 初始时,a[0]自成1个有序区,无序区为a[1..n-1]。令i=1。
2. 将a[i]并入当前的有序区a[0…i-1]中形成a[0…i]的有序区间。
3. i++并重复第二步直到i==n-1。排序完成。
折半插入排序 T(n) = O(n^2)
折半插入排序是对直接插入排序的简单改进,对于折半插入排序而言,当需要插入第i个元素时,它不会逐个进行比较每个元素,而是:
1. 计算0~i-1索引的中间点,也就是用i索引处的元素和(0+i-1)/2索引处的元素进行比较,如果i索引处的元素值大,就直接在(0+i-1)/2~i-1半个范围内进行搜索;反之在0~(0+i-1)/2半个范围内搜索,这就是所谓的折半
2. 在半个范围内搜索时,按照1的方法不断地进行折半搜索,这样就可以将搜索范围缩小到1/2、1/4、1/8…,从而快速的确定插入位置
链表插入排序 T(n) = O(n^2)
链表插入排序的基本思想是:假设前 n-1个节点有序,取最后节点,沿链表依次查找比较,直到合适位置,修改「本节点」和「待插入节点」的指针。
1. 沿头节点遍历链表,比较此节点、待插入节点、后继节点的大小关系,直到:此节点 < 待插入节点 < 后继节点。
2. 令「此节点」指向「待插入节点」,「待插入节点」指向「后继节点」。
Shell 排序(希尔排序) T(n) = O(n^1.5)
希尔排序的实质就是分组插入排序,该方法又称缩小增量排序。该方法的基本思想是:
1. 先将整个待排元素序列分割成若干个子序列(由相隔某个“增量”的元素组成的)分别进行直接插入排序
2. 然后依次缩减增量再进行排序,待整个序列中的元素基本有序(增量足够小,1)时,再对全体元素进行一次直接插入排序
冒泡排序 T(n) = O(n^2)
冒泡排序的基本思想是,对相邻的元素进行两两比较,顺序相反则进行交换,这样,每一趟会将最小或最大的元素“浮”到顶端,最终达到完全有序。
快速排序 范围T(n) = O(n*lg n) ~ O(n^2) | 平均T(n) = O(n*lg n)
快速排序采用了分治(递归)的方法,该方法的基本思想是:
先从数列中取出一个数作为基准数
分区过程,将比这个数大的数全放到它的右边,小于或等于它的数全放到它的左边
再对左右区间重复第二步,直到各区间只有一个数
直接选择排序 T(n) = O(n^2)
直接选择排序(Straight Select Sorting) 也是一种简单的排序方法,它的基本思想是:
1. 从R[0]~R[n-1]中选取最小值,与R[0]交换
2. 从R{1}~R[n-1]中选取最小值,与R[1]交换
3. 第i次从R[i-1]~R[n-1]中选取最小值,与R[i-1]交换
堆选择排序 T(n) = O(n*log2n)
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。堆分为大根堆和小根堆,下图为小根堆:
「如图所示依次类推」
归并排序 T(n) = O(n*log2n)
归并排序是建立在归并操作上的一种有效的排序算法,采用了分治思想。如下图的二路归并:
基数排序
基数排序(radix sort)属于「分配式排序」,有点类似 「桶排」。
1. 分配10个桶,桶编号为0-9,以个位数数字为桶编号依次入桶,将桶里的数字顺序取出来
2. 再次入桶,不过这次以十位数的数字为准,进入相应的桶,同一桶内有序
3. 再次取出,排序完成
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25