数据结构十大排序算法

排序算法0. 算法概述0.1 算法分类0.2 算法复杂度0.3 总结1. 冒泡排序1.1 算法描述1.2 算法分析1.3 动图演示1.4 代码实现2. 选择排序2.1 算法描述2.2 算法分析2.3 动图演示2.4 代码实现3. 插入排序3.1 算法描述3.2 算法分析3.3 动图演示3.4 代码实现4. 希尔排序4.1 算法描述4.2 算法分析4.3 动图演示4.4 代码实现5. 归并排序5.1

Yongliang Xu（许永亮）

692人浏览 · 2020-05-14 00:29:19

Yongliang Xu（许永亮） · 2020-05-14 00:29:19 发布

排序算法

0. 算法概述
- 0.1 算法分类
- 0.2 算法复杂度
- 0.3 总结
1. 冒泡排序
- 1.1 算法描述
- 1.2 算法分析
- 1.3 动图演示
- 1.4 代码实现
2. 选择排序
- 2.1 算法描述
- 2.2 算法分析
- 2.3 动图演示
- 2.4 代码实现
3. 插入排序
3.1 算法描述
3.2 算法分析
- 3.3 动图演示
- 3.4 代码实现
4. 希尔排序
- 4.1 算法描述
- 4.2 算法分析
- 4.3 动图演示
- 4.4 代码实现
5. 归并排序
- 5.1 算法描述
- 5.2 算法分析
- 5.3 动图演示
- 5.4 代码实现
6. 快速排序
- 6.1 算法描述
- 6.2 算法分析
- 6.3 动图演示
- 6.4 代码实现
7. 堆排序
- 7.1 算法描述
- 7.2 算法分析
- 7.3 动图演示
- 7.4 代码实现
8. 计数排序
- 8.1 算法描述
- 8.2 算法分析
- 8.3 动图演示
- 8.4 代码实现
9. 桶排序
- 9.1 算法描述
- 9.2 算法分析
- 9.3 动图演示
- 9.4 代码实现
10. 基数排序
- 10.1 算法描述
- 10.2 算法分析
- 10.3 动图演示
- 10.4 代码实现
基数排序 vs 计数排序 vs 桶排序

0. 算法概述

0.1 算法分类

两大类

十种常见排序算法可以分为两大类：

非线性时间比较类排序：通过比较来决定元素间的相对次序，由于其时间复杂度不能突破O(nlogn)，因此称为非线性时间比较类排序。
线性时间非比较类排序：不通过比较来决定元素间的相对次序，它可以突破基于比较排序的时间下界，以线性时间运行，因此称为线性时间非比较类排序。

比较与非比较

比较：快速排序、归并排序、堆排序、冒泡排序
在排序的最终结果里，元素之间的次序依赖于它们之间的比较。每个数都必须和其他数进行比较，才能确定自己的位置。
非比较：计数排序、基数排序、桶排序
非比较排序是通过确定每个元素之前，应该有多少个元素来排序。针对数组arr，计算arr之前有多少个元素，则唯一确定了arr在排序后数组中的位置。

在这里插入图片描述

0.2 算法复杂度

在这里插入图片描述

0.3 总结

在这里插入图片描述

1. 冒泡排序

冒泡排序是一种简单的排序算法。它重复地走访过要排序的数列，一次比较两个元素，如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢**“浮”**到数列的顶端。

1.1 算法描述

比较相邻的元素：如果第一个比第二个大，就交换它们两个；

对每一对相邻元素作同样的工作，从开始第一对到结尾的最后一对，这样在最后的元素应该会是最大的数；

针对所有的元素重复以上的步骤，除了最后一个；

重复步骤1~3，直到排序完成。

1.2 算法分析

排序方式：in-place

时间复杂度：

最佳情况：T(n) = O(n)
最差情况：T(n) = O(n²)
平均情况：T(n) = O(n²)

空间复杂度：O(1)

1.3 动图演示

在这里插入图片描述

1.4 代码实现

在这里插入图片描述

2. 选择排序

表现最稳定的排序算法之一，因为无论什么数据进去都是O(n²)的时间复杂度，所以用到它的时候，数据规模越小越好。唯一的好处可能就是不占用额外的内存空间了吧。理论上讲，选择排序可能也是平时排序一般人想到的最多的排序方法了。

选择排序(Selection-sort)是一种简单直观的排序算法。

工作原理：首先在未排序序列中找到最小（大）元素，存放到排序序列的起始位置，然后，再从剩余未排序元素中继续寻找最小（大）元素，然后放到已排序序列的末尾。以此类推，直到所有元素均排序完毕。

源于优先级排序：每个元素加入到未排序的列表的时间复杂度O(1)，第一阶段时间复杂度O(n)；第二阶段remove_min操作时间复杂度为O(n²)，总时间复杂度为O(n²)

2.1 算法描述

n个记录的直接选择排序可经过n-1趟直接选择排序得到有序结果。具体算法描述如下：

初始状态：无序区为R[1…n]，有序区为空；

第i趟排序(i=1,2,3…n-1)开始时，当前有序区和无序区分别为R[1…i-1]和R(i…n）。该趟排序从当前无序区中-选出关键字最小的记录R[k]，将它与无序区的第1个记录R交换，使R[1…i]和R[i+1…n)分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区；

n-1趟结束，数组有序化了。

2.2 算法分析

排序方式：in-place

时间复杂度：

最佳情况：T(n) = O(n²)
最差情况：T(n) = O(n²)
平均情况：T(n) = O(n²)

空间复杂度：O(1)

2.3 动图演示

在这里插入图片描述

2.4 代码实现

在这里插入图片描述

3. 插入排序

插入排序（Insertion-Sort）的算法描述是一种简单直观的排序算法。它的工作原理是通过构建有序序列，对于未排序数据，在已排序序列中从后向前扫描，找到相应位置并插入。插入排序在实现上，通常采用in-place排序（即只需用到O(1)的额外空间的排序），因而在从后向前扫描过程中，需要反复把已排序元素逐步向后挪位，为最新元素提供插入空间。

源于优先级序列：第一阶段是将为排序数据加入到已排序序列中，每次add操作时间复杂度为O(n)，第一阶段的时间复杂度是O(n²)；第二阶段是remove_min操作，时间复杂度是O(n)，总时间复杂度是O(n²)

3.1 算法描述

一般来说，插入排序都采用in-place在数组上实现。具体算法描述如下：

从第一个元素开始，该元素可以认为已经被排序；
取出下一个元素，在已经排序的元素序列中从后向前扫描；
如果该元素（已排序）大于新元素，将该元素移到下一位置；
重复步骤3，直到找到已排序的元素小于或者等于新元素的位置；
将新元素插入到该位置；
重复步骤2~5。

3.2 算法分析

排序方式：in-place

时间复杂度：

最佳情况：T(n) = O(n)
最坏情况：T(n) = O(n²)
平均情况：T(n) = O(n²)

额外空间复杂度：O(1)

3.3 动图演示

在这里插入图片描述

3.4 代码实现

在这里插入图片描述

4. 希尔排序

希尔排序是希尔（Donald Shell）于1959年提出的一种排序算法。希尔排序也是一种插入排序，它是简单插入排序经过改进之后的一个更高效的版本，也称为缩小增量排序，同时该算法是冲破O(n²）的第一批算法之一。它与插入排序的不同之处在于，它会优先比较距离较远的元素。

希尔排序是把记录按下表的一定增量分组，对每组使用直接插入排序算法排序；随着增量逐渐减少，每组包含的关键词越来越多，当增量减至1时，整个文件恰被分成一组，算法便终止。

4.1 算法描述

希尔排序的基本步骤：

选择增量：gap=length/2，缩小增量：gap = gap/2

增量序列：用序列表示增量选择，{n/2, (n/2)/2, …, 1}

希尔排序的增量序列的选择与证明是个数学难题，我们选择的这个增量序列是比较常用的，也是希尔建议的增量，称为希尔增量，但其实这个增量序列不是最优的。此处我们做示例使用希尔增量。

先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序，具体算法描述：

选择一个增量序列t1，t2，…，tk，其中t_i>t_j，t_k=1；

按增量序列个数k，对序列进行k趟排序；

每趟排序，根据对应的增量t_i，将待排序列分割成若干长度为m 的子序列，分别对各子表进行直接插入排序;

仅增量因子为1 时，整个序列作为一个表来处理，表长度即为整个序列的长度。
在这里插入图片描述

4.2 算法分析

排序方式：in-place

时间复杂度：

最佳情况：T(n) = O(n)
最坏情况：T(n) = O(n²)
平均情况：T(n) =O(n^1.3)

空间复杂度：O(1)

4.3 动图演示

在这里插入图片描述

4.4 代码实现

在这里插入图片描述

5. 归并排序

归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法（Divide and Conquer）的一个非常典型的应用。将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成一个有序表，称为2-路归并。

和选择排序一样，归并排序的性能不受输入数据的影响，但表现比选择排序好的多，因为始终都是**O(n·log n)**的时间复杂度(稳定)。

5.1 算法描述

把长度为n的输入序列分成两个长度为n/2的子序列；
对这两个子序列分别采用归并排序；
将两个排序好的子序列合并成一个最终的排序序列。

5.2 算法分析

排序方式：out-place

时间复杂度：

最佳情况：T(n) = O(nlog n)
最差情况：T(n) = O(nlog n)
平均情况：T(n) = O(nlog n)

空间复杂度：O(n)

5.3 动图演示

在这里插入图片描述

5.4 代码实现

在这里插入图片描述

6. 快速排序

快速排序的基本思想：通过一趟排序将待排记录分隔成独立的两部分，其中一部分记录的关键字均比另一部分的关键字小，则可分别对这两部分记录继续进行排序，以达到整个序列有序。

6.1 算法描述

快速排序使用分治法来把一个串（list）分为两个子串（sub-lists）。具体算法描述如下：

从数列中挑出一个元素，称为 “基准”（pivot），即枢纽元；
重新排序数列，所有元素比基准值小的摆放在基准前面，所有元素比基准值大的摆在基准的后面（相同的数可以到任一边），在这个分区退出之后，该基准就处于数列的中间位置，称为分区（partition）操作；
递归地（recursive）把小于基准值元素的子数列和大于基准值元素的子数列排序。

6.2 算法分析

排序方式：in-place

时间复杂度：

最佳情况：T(n) = O(nlog n)
最差情况：T(n) = O(n²)
平均情况：T(n) = O(nlog n)

空间复杂度：

平均：O(log n)
最差： O(n)

6.3 动图演示

在这里插入图片描述

6.4 代码实现

在这里插入图片描述

7. 堆排序

堆排序（Heapsort）是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构，并同时满足堆积的性质：即子结点的键值或索引总是小于（或者大于）它的父节点。
源于优先级序列：第一阶段，add操作整体时间复杂度为O(nlog n)；若第一阶段采用自底而上构建堆，时间复杂度为O(n)；第二阶段remove_min操作整体时间复杂度为O(nlog n)，总体时间复杂度为O(nlog n)

7.1 算法描述

将初始待排序关键字序列(R1,R2….Rn)构建成大顶堆，此堆为初始的无序区；
将堆顶元素R[1]与最后一个元素R[n]交换，此时得到新的无序区(R1,R2,……Rn-1)和新的有序区(Rn),且满足R[1,2…n-1]<=R[n]；
由于交换后新的堆顶R[1]可能违反堆的性质，因此需要对当前无序区(R1,R2,……Rn-1)调整为新堆，然后再次将R[1]与无序区最后一个元素交换，得到新的无序区(R1,R2….Rn-2)和新的有序区(Rn-1,Rn)。
不断重复此过程直到有序区的元素个数为n-1，则整个排序过程完成。不断重复此过程直到有序区的元素个数为n-1，则整个排序过程完成。