算法学习之线性时间排序之基数排序,计数排序及java实现
先介绍一下概念
计数排序和基数排序都是非比较排序,就是不用进行比较就能排序,相对于堆排序,快速排序,插入排序等都是比较排序,比较排序算法的最坏情况下届都要做0(nlgn)次的比较,堆排序和合并排序都是渐近最有的比较排序算法,线性时间排序的时间复杂度都是O(n)。
计数排序的基本思想,假设n个输入元素中的每一个都是介于0到k的整数,此处k为某个整数。当k=O(n)时,计数排序运行时间是O(n),计数排序基本思想是对每一个输入元素x,确定出小于x的元素个数,这样可以把x直接放在最终输出的位置上。例如,有15个元素小于x,那么x就放在第18个输出位置。当有元素相同时,放完后小于个数要减1。
另外需要两个数组,存放最终结果的数组和存放临时存储的数组(即小于x的个数)。 它是稳定的。具有相同值的元素在输出数组中的相对次序与他们在输入数组的次序相同。基数排序的基本思想,基数排序可以说是扩展了的桶式排序,比如当待排序列在一个很大的范围内,比如0到999999内,那么用桶式排序是很浪费空间的。而基数排序把每个排序码拆成由d个排序码,比如任何一个6位数(不满六位前面补0)拆成6个排序码,分别是个位的,十位的,百位的。。。。
一般有两种方式:
1) 高位优先(MSD): 从高位到低位依次对序列排序
2)低位优先(LSD): 从低位到高位依次对序列排序
计算机一般采用低位优先法(人类一般使用高位优先),但是采用低位优先时要确保排序算法的稳定性。
基数排序借助桶式排序,每次按第N位排序时,采用桶式排序。对于如何安排每次落入同一个桶中的数据有两种安排方法:
1)顺序存储:每次使用桶式排序,放入r个桶中,,相同时增加计数。
2)链式存储:每个桶通过一个静态队列来跟踪。 举个例子:
现在有数组:2,10,78,189,354,8,756,390,356。第一次根据各位数将数组划分为10个队列(当然其中的某些队列可能不含有元素)
0:10,390
1:
2:2
3:
4:354
5:
6:756,356
7:
8:78,8
9:189
然后收集成序列:
10,390,2,354,756,356,78,8,189
在进行第二次分组:
0:2,8
1:10
2:
3:
4:
5:354,756,356
6:
7:78
8:189
9:390
第二次收集:
2,8,10,354,756,356,78,189,390
第三次分配:
0:2,8,10,78
1:189
2:
3:354,356,390
4:
5:
6:
7:756
8:
9:
最后得到序列:2,8,10,78,189,354,356,390,756。完成排序!
基数排序其实是利用多关键字先达到局部有序,再调整达到全局有序。 虽然根据常见情况,有b=O(lgn),基数排序运行时间为Θ(n),看上去比快排的平均Θ(nlgn)更好吧。不过,隐含在Θ符号中的常数因子是不同的。对于要处理的n个关键字,尽管基数排序执行的遍数比快排少,但每一遍的时间要长,所以,哪一个排序更好,取决于底层机器的实现特性(比如,快排通常可以比基数更好的利用硬件缓存),同时还取决于输入数据。此外,利用计数排序作为中间稳定排序的基数排序不是原地排序,而很多 Θ(nlgn)的比较排序算法则可以做到原地排序。因此,内存容量宝贵时,像快排这样的原地排序算法也许更可贵。(来自算法导论) 桶排序:其基本思想:将区间[0,1]划分为n个相同大小的子区间,也叫桶,然后将n个输入分布到桶中。由于输入均匀,所以,一般不会有一个桶有很多数的情况。输出时,先将每个桶进行排序,然后依次输出各桶元素。其伪代码如下:

代码写的比较详细,不多说,具体看代码,注释都说的比较清楚了。
具体实现: