解析从堆到优先队列的实现

开发 后端
优先队列,顾名思义,就是一种根据一定优先级存储和取出数据的队列。它可以说是队列和排序的完美结合体,不仅可以存储数据,还可以将这些数据按照我们设定的规则进行排序。

优先队列,顾名思义,就是一种根据一定优先级存储和取出数据的队列。它可以说是队列和排序的***结合体,不仅可以存储数据,还可以将这些数据按照我们设定的规则进行排序。

先说说优先队列的实现吧。有一点需要澄清,很多人一直以为Priority Queue就是一个Priority Heap,这种说法当然是片面的。既然优先队列只是存储数据和排序的结合,那么根据我们学过的知识,可以列出以下的实现方法:无序数组、无序链表、有序数组、有序链表以及二叉查找树,当然还有堆。这些方法在实现中当然也有优先级,下表就是一些方法的实现基本操作的时间性能对比:


图1 一些优先队列的实现方案的时间性能对比

从这张表里我们可以按照时间复杂度这个优先级来进行一次排序,当然,你会选用***一种二叉查找树作为实现优先队列的方案,但是实际上我们采用的是堆。堆,就是一种二叉树,堆和二叉查找树是类似的,但是也有些许不同:从形状来看,二叉查找树可以有不同的形状,而堆只能是完全二叉树;在时间性能上,二者并无明显的区别。堆也是有序的,我们一般将其分为大顶堆和小顶堆。小顶堆,顾名思义,就是这个堆的子结点的值小于父结点的值;相反的,大顶堆就是堆的子结点的值都大于父结点的值。

在实现的时候,我们常常使用基于数组的堆,即堆中的元素保存在一个数组中,而这个数组元素的保存也是按照一定规律的:如果父结点的位置为n,那么,其对应的左右子结点的位置分别是2n+1和2n+2。也就是说,我们在视觉上(如果用画图形象化表示堆的话)和本质上将堆打扮成两种东西,这样既便于理解,也利于实现,本质的实现是用数组是因为考虑到数组的一些性能。

堆有两个很基本的操作:增加、删除。先来说说增加元素,假设有下面这样一个堆:

这时候,有一个元素1要添加进来,这时候应该怎么办呢?***步,将元素添加到堆的***一个位置:

第二步,将新加入的元素与其父结点的值进行比较,若新结点的值比其父结点的值要小(就像这个例子一样),那么,交换两个结点的值,重复第二步,直到形成一个小顶堆:

这样,一个新的小顶堆诞生了!

然后就是从堆中删除一个元素了,假设在这个新的小顶堆中,我们打算删除值为1的那个结点:

***步,将这个1删掉,假设其结点上当前没有值:

第二步,比较该删除结点(当前是最上面的那个)的两个子结点,看谁的值小,交换其中较小值和这个空结点的值(假设是null),然后重复这一步,直到该空值到最小面一行:

第三步,就是将这个空的结点从视线中移除了,这样,删除的过程就告一段落了(好吧,这个堆又回到解放前了)!

知道了这些基本的原理,对数据量更大的增加和删除也应该是触类旁通了吧。

有人会质疑堆中除堆顶元素之外的其他元素的顺序问题:

比如这里为什么4会放在5的右边兄弟结点上,这明显是受了二叉查找树的影响,因为堆对我们来说,一般只有堆顶元素有用,因此只要保证堆顶元素是最小的就行了(对小顶堆)。

下面,简单介绍一下sun提供的PriorityQueue的一些基本的方法,以此来较为深入地理解优先队列的实现机制:

1.下面是PriorityQueue的声明的***句话:

这句话表明:sun提供的优先队列是基于优先堆实现的;

2.下面是声明一个Object数组时的注释:

由此可知,堆中的元素在数组中的保存方案;并且队列中的优先级最小的元素总是保存在queue[0]中,前提是该优先队列不为空。

下面是往PriorityQueue中上滤的方法:

这段代码中,k代表当前加入元素的位置,即***一个位置+1,x表示要添加的元素。首先得到父结点的值,然后将x的值和父结点的值进行比较,如果子结点的值大于父结点值,不作更改,否则交换两者的值。这个方法主要用于添加元素的时候。与之相对应的有一个下滤方法siftDownComparable(),其功能是向下比较,用在删除元素的实现中;

接下来就讲添加元素的实现:

这里可以看到用到了siftUp方法,其实,siftUp中分情况调用了 siftUpUsingComparator()、siftUpComparable()。这在刚才已经介绍了上滤的实现了。这里的添加元素就是上滤的过程。

当然,我们在使用时,一般使用的方法是这三种:add、poll以及peek,add用以添加元素,其内部是用offer方法实现的,peek用来得到堆顶元素,但是不删除,而poll在返回堆顶元素之后,将堆顶元素删除。

以上只是对优先队列的简要介绍,作为一个应用比较广泛的数据结构,优先队列还有许许多多奇妙的地方,它们都等着你去发现。

原文链接:http://februus.iteye.com/blog/1288305

【编辑推荐】

  1. Java代码规范那些事
  2. Java效率真的很低吗?Android为何要采用?
  3. 漫谈Java开源5年:自由但带着枷锁
  4. Java字节码深入解析
  5. BicaVM:基于JavaScript的JVM-为什么呢?
责任编辑:林师授 来源: 风子柒的博客
相关推荐

2022-04-18 07:01:36

二叉堆大根堆小根堆

2012-03-31 10:49:18

ibmdw

2009-04-20 10:09:46

C#优先队列.NET Framew

2024-03-11 07:46:40

React优先级队列二叉堆

2023-08-08 08:28:03

消息消费端Spring

2021-03-01 23:31:48

队列实现栈存储

2019-10-22 08:12:49

消息队列分布式系统

2021-07-19 11:54:15

MySQL优先队列

2024-03-18 00:00:03

RabbitMQ代码延迟队列

2023-10-27 08:42:56

Python字典

2017-01-04 13:42:35

MINIFILTER文件重定向源码

2017-11-01 17:00:13

机器学习算法MiniFlow

2011-12-07 11:24:32

笔记本评测

2022-08-11 08:03:43

队列

2020-11-23 08:53:34

堆Heap

2023-10-30 15:51:43

ByteHouse大数据

2023-04-06 08:01:30

RustMutex

2015-05-06 09:44:15

UnitedStackIaaSOpenStack

2015-05-07 09:32:37

IaaS架构统一存储OpenStack

2015-05-07 15:19:47

IaaSPaaSAzure
点赞
收藏

51CTO技术栈公众号