上一篇介绍了归并排序,本文介绍快速排序,顾名思义,应该是综合性能最好的排序了。在具体实现上,往上也有很多的版本,虽然大体思想一致,但是我觉得掌握其中一种最实用的方式就够了,本文的快排思想基于荷兰国旗问题演变,即所谓的三路快排,对于重复元素较多的场景是非常适合的,对于普通场景来说,性能也不弱。
1. 荷兰国旗问题
在研究快速排序之前,我们先来研究一下一个经典问题:荷兰国旗问题,我们的目标是给出一个num,将原来的数组中的值按照下面的规则进行排列:比num小的全放到num的左边,比bum大的全部放在右边,中间全是等于num的值。类似于荷兰国旗的三色旗。
具体的算法思想看代码注释:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 public class helan_flag_question_solve { public static void main (String[] args) { int [] arr = {1 ,1 ,3 ,1 ,3 ,2 ,2 ,1 ,1 ,3 }; solve(arr,0 ,arr.length-1 ,2 ); for (int i=0 ;i<arr.length;i++){ System.out.print(arr[i] + " " ); } } private static void solve (int [] arr,int L,int R,int num) { int less = L-1 ; int more = R+1 ; int curr = L; while (curr < more){ if (arr[curr] < num){ swap(arr,++less,curr++); }else if (arr[curr] > num){ swap(arr,--more,curr); }else { curr++; } } } private static void swap (int [] arr, int i, int j) { int tmp = arr[i]; arr[i] = arr[j]; arr[j] = tmp; } }
这道题目一定一定要注意边界问题。下面的快排其实就是对荷兰国旗问题的递归操作。因此要想理解快排,需要先掌握荷兰国旗问题。
2. 快排
快速排序的基本思想:通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,则可分别对这两部分记录继续进行排序,以达到整个序列有序。
快速排序使用分治法来把一个串(list)分为两个子串(sub-lists)。具体算法描述如下:
从数列中挑出一个元素,称为 “基准”(pivot);
重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
时间复杂度为O(N*logN),额外空间复杂度O(logN);
因为要记录划分区域的边界,所以需要一定的空间。这里划分的空间与二分的次数有关,所以需要O(logN)。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 private void quick_sort (int [] input,int low,int high) { if (low < high){ int [] p = partion(input,low,high); quick_sort(input,0 ,p[0 ]-1 ); quick_sort(input,p[1 ]+1 ,high); } } private int [] partion(int [] input,int L,int R){ int less = L - 1 ; int more = R + 1 ; int curr = L; int num = input[L]; while (curr < more){ if (input[curr] < num){ swap(input,++less,curr++); }else if (input[curr] > num){ swap(input,curr,--more); }else { curr++; } } return new int []{less,more}; } private void swap (int [] arr, int i, int j) { int tmp = arr[i]; arr[i] = arr[j]; arr[j] = tmp; }
快排存在的一个问题是:可能划分出来两边数组很偏,排序效率就会变差。可以用随机快排进行改进。
思路:随机选一个数与数组最后一个数交换。
1 swap(arr,L+(int)(Math.random()*(R-L+1)),R);
相比于经典快排,这个优化的快排的优点在于:每一次partition之后,就可能会揪出一串的相等数字,然后左边全是小于这个数,右边都是大于这个数。而经典快排每次只找出一个数字来,左边是小于等于这个数,右边是大于这个数。很显然,优化后的快排要快一点。
这种从荷兰国旗演变过来的快排,对于重复元素较多的时候是非常有利的,因此这种是我比较喜欢的一种写法,这也意味着快排的实现上有一些差异,但是主要的思想是一致的,即分治处理。