快速排名新算法怎么用?【教你快速排名新算法的9个步骤】

访客4年前黑客文章539

前言

快速排序,正如它的名字所体现,是在实践中已知的最快的排序算法,平均运行时间为O(NlogN),最坏的运行时间为O(N^2)。算法的基本思想很简单,然而想要写出一个高效的快速排序算法并不是那么简单。基准的选择,米素的分割等都至关重要,如果你不清楚如何优化快速排序算法,本文你不该错过。

算法思想

快速排序利用了分治的策略。而分治的基本基本思想是:将原问题划分为若干与原问题类似子问题,解决这些子问题,将子问题的解组成原问题的解。

那么如何利用分治的思想对数据进行排序呢?假如有一个米素 *** A:

  • 选择A中的任意一个米素pivot,该米素作为基准

  • 将小于基准的米素移到左边,大于基准的米素移到右边(分区操作)

  • A被pivot分为两部分,继续对剩下的两部分做同样的处理

  • 直到所有子集米素不再需要进行上述步骤

可以看到算法思想比较简单,然而上述步骤实际又该如何处理呢?

如何选择基准

实际上无论怎么选择基准,都不会影响排序结果,但是不同的选择却可能影响整体排序时间,因为基准选择不同,会导致分割的两个 *** 大小不同,如果分割之后,两个 *** 大小是几乎相等的,那么我们整体分割的次数显然也会减少,这样整体耗费的时间也相应降低。我们来看一下有哪些可选择策略。

选择之一个或者最后一个

如果待排序数是随机的,那么选择之一个或者最后一个作基准是没有什么问题的,这也是我们最常见到的选择方案。但如果待排序数据已经排好序的,就会产生一个很糟糕的分割。几乎所有的数据都被分割到一个 *** 中,而另一个 *** 没有数据。这样的情况下,时间花费了,却没有做太多实事。而它的时间复杂度就是最差的情况O(N^2)。因此这种策略是绝对不推荐的

随机选择

随机选择基准是一种比较安全的做法。因为它不会总是产生劣质的分割。

C语言实现参考:

选择三数中值

从前面的描述我们知道,如果能够选择到数据的中值,那是更好的,因为它能够将 *** 近乎等分为二。但是很多时候很难算出中值,并且会耗费计算时间。因此我们随机选取三个米素,并用它们的中值作为整个数据中值的估计值。在这里,我们选择最左端,最右端和中间位置的三个米素的中值作为基准。

假如有以下数组:

左端米素为1,位置为0,右端米素为4,位置为8,则中间位置为[0+8]/2=4,中间米素为8。那么三数中值就为4(1,4,8的中值)。

如何将米素移动到基准两侧

选好基准之后,如何将米素移动到基准两侧呢?通常的做法如下:

  • 将基准米素与最后的米素交换,使得基准米素不在被分割的数据范围

  • i和j分别从之一个米素和倒数第二个米素开始。i在j的左边时,将i右移,直到发现大于等于基准的米素,然后将j左移,直到发现小于等于基准的米素。i和j停止时,米素互换。这样就把大于等于基准的移到了右边,小于等于基准的移到了左边

  • 重复上面的步骤,直到i和j交错

  • 将基准米素与i所指向的米素交换,使得基准米素将整个米素 *** 分割为小于基准和大于基准的米素 ***

在们采用三数中值得 *** 选择基准的情况下,既然基准是中值,实际上只要保证左端,右端,中间值是从小到大即可。还是以前面提到的数组为例,我们找到三者后,对三者进行排序如下:

排序前

排序后

如果是这样的情况,那么实际上不需要把基准米素和最后一个米素交换,而只需要和倒数第二个米素交换即可,因为最后一个米素肯定大于基准,这样可以减少交换次数

如果前面的描述还不清楚,我们看一看实际中一趟完整的流程是什么样的。

之一步,将左端,右端和中间值排序,中值作为基准:

第二步,将中值与倒数第二个数交换位置:

第三步,i向右移动,直到发现大于等于基准的米素9:

第四步,j向左移动,直到发现小于等于基准的米素2:

第五步,交换i和j:

第六步,重复上述步骤,i右移,j左移:

第七步,交换i和j指向的值:

第八步,重复上述步骤,i右移,j左移,此时i和j已经交错:

第九步,i和j已经交错,因此最后将基准米素与i所指米素交换:

如何对子集进行排序到这一步的时候,我们发现i的左边都是小于i指向的米素,而右边都是大于i的米素。最后在对子集进行同样的操作即可。

递归法

最常见的便是递归法了。递归的好处是代码简洁易懂,但是不可忽略的是,当递归嵌套过深时,它的效率问题以及栈溢出的风险可能会迫使你选择非递归法。在前面对整个 *** 一分为二之后,对剩下的两个 *** 递归调用,直到完成排序。简单描述如下(非可运行代码):

递归最需要注意的便是递归结束调用,否则会产生无限递归,从而发生栈溢出。

后面我们会看到,递归法的代码非常简洁。(相关阅读《面试官问你斐波那契数列的时候不要高兴得太早》)

尾递归

在递归版本中,Qsort分别递归调用计算左右两个子 *** ,而第二个递归其实并非必须,完全可以用循环来替代,以下代码模拟实现了尾递归,(并非是真的尾递归):

非递归法

那么有没有 *** 可以不用递归呢?既然递归每次都进行压栈操作,那么我们能不能分区后仅仅将区间信息存储到栈里,然后从栈中取出区间再继续分区呢?显然是可以的。实际上我们每次分区时,只需要知道区间即可,那么将这些区间信息存储起来,就可以不用递归了,按照分好的区间不断分区即可。

例如对于前面提到的数组,首先对区间[0,8]进行分区操作,之后得到两个新的分区,1,2,3和9,7,6,10,8,假设两个区间仍然可以使用快速排序,那么需要将区间[0,2]和[5,8]的其中一个压栈,另一个继续分区操作。

按照这种思路,代码简单描述如下(非可运行代码):

当然这里面没有体现分区终止条件。我们需要在数据量小于一定值的时候,就不再继续进行分区操作了,而是选择插入排序(为什么?)。

那么问题来了,如何选择栈的大小呢?查看qsort.c的源码发现,它选择了如下的值:

为什么会是这个值呢?设想一下,假设待排序数组长度使用unsigned long int来表示,并且假设每次都将 *** 分为二等分。那么即便数组长度达到更大值,实际上最多只需要分割8 *(sizeof(unsigned long int))次,也就将它分割完了。然而由于以下几个原因,需要存储在栈中的区间信息很难超出栈空间,因为:

  • 数组长度不会接近unsigned long int,否则内存也撑不住了

  • 区间足够小时,不采用快速排序

  • 每做一个分区,只会增加一个区间PUSH到栈中,增长速度慢

注意事项

至此,快速排序所有的主要步骤已经介绍完毕。但是有以下注意事项:

  • 有大量重复米素时避免产生糟糕分区,因此在发现大于等于基准或者小于等于基准时,便停止扫描。

  • 通常会将基准一开始移动到最后位置或倒数第二个位置,避免基准在待分区区间。

  • 对于很小的数组(N<=20),插入排序要比快速排序更好。因为快速排序有递归开销,并且插入排序是稳定排序。

  • 如果函数本身的局部变量很少,那么递归带来的开销也就越小;如果递归发生栈溢出了,首先需要排除代码设计问题。因此如果你设计的非递归版本效率低于递归版本,也不要惊讶。

注:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。–来自百科

递归版代码实现

C语言代码实现如下:

尾递归版代码实现

非递归版代码实现

非递归版与递归版大部分代码相同,Qsort函数有所不同,并且增加栈相关内容定义:

运行结果

我们随机产生1亿个整数,并对其进行排序:

递归版运行结果:

非递归版结果:

可以看到,实际上两种 *** 的效率差距并不是很大。至于原因,前面我们已经说过了。

总结

本文所写的示例实现与glibc的实现相比,还有很多可优化的地方,例如,本文实现仅对int类型实现了排序或交换值,如果待排序内容是其他类型,就显得力不从心,读者可参考《高级指针话题函数指针》思考如何实现对任意数据类型进行排序,。但快速排序的优化主要从以下几个方面考虑:

  • 优化基准选择

  • 优化小数组排序效率

  • 优化交换次数

  • 优化递归

  • 优化最差情况,避免糟糕分区

  • 米素聚合

有兴趣地也可以进一步阅读qsort源码,了解更多优化细节。


相关文章

Helix3Pro是不是完全免费?

Helix3Pro是不是完全免费?

什么叫Helix3 Pro? 如同之前的专用工具一样,Helix3 Pro是为计算机取证订制的与众不同专用工具。它早已十分细心地建立,以防止以一切方法触碰服务器,而且它是法医鉴定的。好的是Helix...

湘潭私家侦探公司(正规私人侦探公司怎么找)

男生客观女性情感,因此许多女性都被男人运用了这一点。而女士又缺乏实践经验,在其中绝大多数也都是会意气用事,因此被别人蒙骗就变成了很普遍的事儿。情感这般,但也是有男生运用情感蒙骗钱财,那样的实例在大家邵...

玻璃狗指纹锁怎么样

玻璃狗指纹锁怎么样

  玻璃狗专注于玻璃门类智能锁,智能锁优秀品牌,全球玻璃门智能锁成长先驱,中国创新科技的规范,从设计到研发,从配套到出产,从市场到销售,从售后随处事,为玻璃门提供智能化门控办理方案。那毕竟这个玻璃狗指...

怎样查询好友和别人聊天记录

许多 女士与生俱来都是有第六感,她们会发觉一些丈夫的外遇征兆,随后变为柯南道尔根据侦察得到真实的结果。尤其是当自身的丈夫有出轨的情况下,女士一直能发觉丈夫的异常的地区,因此就要想根据这种真相来寻找丈夫...

网络黑客上那找-黑客qq群号(网络黑客高手qq群2016)

网络黑客上那找-黑客qq群号(网络黑客高手qq群2016)

网络黑客上那找相关问题 黑客解封游戏账号相关问题 黑客是如何入侵你的网站的 黑帽子论坛(黑帽子) 黑客如何攻击网...

怀疑老婆出轨怎么查他的手机记录

现在是科技的时代,相信很多人都吃过这样的亏,就是自己明明把微信聊天记录删除了,可是还是泄露出去的,给我们的生活和工作造成不可弥补的损失,我们的聊天记录是怎么泄露的呢?现在第三方恢复软件那么多,稍微注意...