Fork me on GitHub

算法-堆排序算法

堆排序是利用堆的性质进行的一种选择排序。

时间复杂度:

  • 时间复杂度:O(nlogn)
  • 空间复杂度:O(1)(就地排序,用于堆化(又称筛选)的辅助空间)

性能:

  1. 由于建初始堆所需的比较次数较多,所以堆排序不适宜于记录数较少的。

  2. 堆排序的时间,主要由建立初始堆和反复重建堆这两部分的时间开销构成。

  3. 堆排序是一种不稳定排序。
    科普:(排序的稳定性是指如果在排序的序列中,存在前后相同的两个元素的话,排序前和排序后他们的相对位置不发生变化)。

  4. 即使在最坏情况堆排序的时间复杂仍然为O(nlogn)。而快速排序在最坏情况下会达到O(N^2),所以快排在最好和平均情况下比堆排快,堆排在最坏情况下比快排快。

基本思想:

利用大(小)顶堆堆顶记录的是最大(小)关键字这一特性,使得每次从无序中选择最大(小)记录变得简单。
下面的讨论全部基于大顶堆(小顶堆同理,不再赘述)。

  1. 将初始待排序关键字序列(R1,R2….Rn)构建成大顶堆,此堆为初始的无序区;

  2. 将堆顶元素R[1]与最后一个元素R[n]交换,此时得到新的无序区(R1,R2,……Rn-1)和新的有序区(Rn),且满足R[1,2…n-1]<=R[n];

  3. 由于交换后新的堆顶R[1]可能违反堆的性质,因此需要对当前无序区(R1,R2,……Rn-1)调整为新堆(堆化、筛选),然后再次将R[1]与无序区最后一个元素交换,得到新的无序区(R1,R2….Rn-2)和新的有序区(Rn-1,Rn)。不断重复此过程直到有序区的元素个数为n-1(原堆剩最后一个元素),则整个排序过程完成。

操作过程如下:

  1. 初始化堆:将R[1..n]构造为堆;
  2. 将当前无序区的堆顶元素R[1]同该区间的最后一个记录交换,然后将新的无序区调整为新的堆(不断堆化)。

因此对于堆排序,最重要的两个操作就是构造初始堆和调整堆,其实构造初始堆事实上也是调整堆的过程,只不过构造初始堆是对所有的非叶节点都进行调整。

给定一个整形数组a[]={16,7,3,20,17,8},对其进行堆排序。
首先根据该数组元素构建一个完全二叉树,得到:

这里写图片描述

然后需要构造初始堆,则从最后一个非叶节点开始调整,调整过程如下:

以下为构造初始堆:

  1. 8和3交换,满足;
  2. 20和7交换,导致20和16不满足;
    这里写图片描述这里写图片描述

  3. 20和16交换,导致17和16不满足;

  4. 17和16交换;
    这里写图片描述这里写图片描述

  5. 完成构建(大顶堆)。

即每次调整都是从父节点、左孩子节点、右孩子节点三者中选择最大者跟父节点进行交换(交换之后可能造成被交换的孩子节点不满足堆的性质,因此每次交换之后要重新对被交换的孩子节点进行调整)。有了初始堆之后就可以进行排序了。

以下为交换元素并每步堆化(排序):

  1. 交换3与20; 如下图:
    此时3位于堆顶不满大顶堆的性质,则需继续调整。
    交换3与17,导致3与16不满足;
    交换3与16;
    满足;
    这里写图片描述这里写图片描述这里写图片描述

  2. 交换17与3;如下图:
    此时3位于堆顶不满大顶堆的性质,则需继续调整。
    交换3与16,导致3与7不满足;
    交换3与7;
    满足;
    这里写图片描述这里写图片描述这里写图片描述

  3. 交换16与3;如下图:
    此时3位于堆顶不满大顶堆的性质,则需继续调整。
    交换3与8;
    满足;
    这里写图片描述这里写图片描述
  4. 交换3与8;如下图:
    此时3位于堆顶不满大顶堆的性质,则需继续调整。
    交换3与7;
    满足;
    这里写图片描述这里写图片描述
  5. 交换3与7;如下图:
    满足,完成排序。
    这里写图片描述

这样整个区间便已经有序了。
从上述过程可知,堆排序其实也是一种选择排序,是一种树形选择排序。只不过直接选择排序中,为了从R[1…n]中选择最大记录,需比较n-1次,然后从R[1…n-2]中选择最大记录需比较n-2次。事实上这n-2次比较中有很多已经在前面的n-1次比较中已经做过,而树形选择排序恰好利用树形的特点保存了部分前面的比较结果,因此可以减少比较次数。对于n个关键字序列,最坏情况下每个节点需比较logn次,因此其最坏情况下时间复杂度为nlogn。

算法实现(java):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
/**定义堆*/
static class Heap{
int count;
public int[] Array;
public Heap(int count){
this.count=count;
this.Array=new int[count];
}
/**获取左孩子的方法*/
public int getLeft(int i){
int left=2*i+1;
if(this.Array==null || left>=this.count){return -1;}
return left;
}
/**获取右孩子的方法*/
public int getRight(int i){
int right=2*i+2;
if(this.Array==null || right>=this.count){return -1;}
return right;
}
/**堆化(筛选)*/
public void PercolateDown(int i){
int left,right,max = 0,temp;
left=this.getLeft(i);
right=this.getRight(i);
if(left!=-1 && this.Array[i]>=this.Array[left]){
max=i;
}else{
max=left;
}
if(right!=-1 && this.Array[right]>this.Array[max]){
max=right;
}
//交换,交换完之后结束方法,由外部调用
if(max!=-1 && max!=i){
temp=Array[max];
Array[max]=Array[i];
Array[i]=temp;
PercolateDown(max);
}
}
}
public static void Heapsort(int[] A,int n){
Heap heap=new Heap(n);
int temp;
for(int i=0;i<n;i++){
heap.Array[i]=A[i];
}
//从第一个非叶子节点开始堆化(筛选)
for(int i=(n-1)/2;i>=0;i--){
heap.PercolateDown(i);
}
//第一次堆化完成, 开始交换,最后一个数和第一个数交换一次
for(int i=n-1;i>=0;i--){ //heap.Array[0] 存储最大元素
temp=heap.Array[0];
heap.Array[0]=heap.Array[i];
heap.Array[i]=temp;
//使用count的目的是在getleft的时候避免再去判断已经交换过(排序过)的元素
heap.count--;
//对第一个数不满足则再次进行堆化
heap.PercolateDown(0);
}
long time1=System.nanoTime();
for (int j : heap.Array) {
System.out.println(j);
}
System.out.println(System.nanoTime()-time1);
}

测试程序:

1
2
3
4
public static void main(String[] arg){
int[] A=new int[]{5,14,78,2,14,53,45,1};
Heapsort(A, A.length);
}

打印内容如下:

1
2
3
4
5
6
7
8
9
1
2
5
14
14
45
53
78
337776

csdn地址:http://blog.csdn.net/u012534831
github地址:https://github.com/qht1003077897
个人博客地址:https://qht1003077897.github.io
QQ:1003077897