基础算法9-快速排序
上一篇介绍了归并排序,本文介绍快速排序,顾名思义,应该是综合性能最好的排序了。在具体实现上,往上也有很多的版本,虽然大体思想一致,但是我觉得掌握其中一种最实用的方式就够了,本文的快排思想基于荷兰国旗问题演变,即所谓的三路快排,对于重复元素较多的场景是非常适合的,对于普通场景来说,性能也不弱。
1. 荷兰国旗问题
在研究快速排序之前,我们先来研究一下一个经典问题:荷兰国旗问题,我们的目标是给出一个num,将原来的数组中的值按照下面的规则进行排列:比num小的全放到num的左边,比bum大的全部放在右边,中间全是等于num的值。类似于荷兰国旗的三色旗。
具体的算法思想看代码注释:
1 | /** |
这道题目一定一定要注意边界问题。下面的快排其实就是对荷兰国旗问题的递归操作。因此要想理解快排,需要先掌握荷兰国旗问题。
2. 快排
快速排序的基本思想:通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,则可分别对这两部分记录继续进行排序,以达到整个序列有序。
快速排序使用分治法来把一个串(list)分为两个子串(sub-lists)。具体算法描述如下:
- 从数列中挑出一个元素,称为 “基准”(
pivot
); - 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(
partition
)操作; - 递归地(
recursive
)把小于基准值元素的子数列和大于基准值元素的子数列排序。
时间复杂度为O(N*logN),额外空间复杂度O(logN);
因为要记录划分区域的边界,所以需要一定的空间。这里划分的空间与二分的次数有关,所以需要O(logN)。
1 | private void quick_sort(int[] input,int low,int high){ |
快排存在的一个问题是:可能划分出来两边数组很偏,排序效率就会变差。可以用随机快排进行改进。
思路:随机选一个数与数组最后一个数交换。
1 | swap(arr,L+(int)(Math.random()*(R-L+1)),R); |
相比于经典快排,这个优化的快排的优点在于:每一次partition之后,就可能会揪出一串的相等数字,然后左边全是小于这个数,右边都是大于这个数。而经典快排每次只找出一个数字来,左边是小于等于这个数,右边是大于这个数。很显然,优化后的快排要快一点。
这种从荷兰国旗演变过来的快排,对于重复元素较多的时候是非常有利的,因此这种是我比较喜欢的一种写法,这也意味着快排的实现上有一些差异,但是主要的思想是一致的,即分治处理。