数据结构之归并排序
归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer)策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。
将数组分解最小之后,然后合并两个有序数组,基本思路是比较两个数组的前面的数,谁小就先取谁,取了后相应的指针就往后移一位,直至一个数组为空,最后把另一个数组的剩余部分复制过来即可。
可以看到这种结构很像一棵完全二叉树,本文的归并排序我们采用递归去实现(也可采用迭代的方式去实现)。分阶段可以理解为就是递归拆分子序列的过程,递归深度为log2n。
合并相邻有序子序列
再来看看治阶段,我们需要将两个已经有序的子序列合并成一个有序序列,比如上图中的最后一次合并,要将[4,5,7,8]和[1,2,3,6]两个已经有序的子序列,合并为最终序列[1,2,3,4,5,6,7,8],来看下实现步骤。
归并排序算法分析
归并排序算法是一种递归排序算法,其原理是:先将序列进行递归分解,分解到不能再分解为止;然后在进行相邻的两两排序合并,最后完成排序。
一般归并排序算法的递归分解,是使用折半分解。
以序列 [54, 26, 93, 17, 77, 31, 44, 55, 20] 为例
归并排序是稳定排序,它也是一种十分高效的排序,能利用完全二叉树特性的排序一般性能都不会太差。从上文的图中可看出,每次合并操作的平均时间复杂度为O(n),而完全二叉树的深度为|log2n|。总的平均时间复杂度为O(nlogn)。而且,归并排序的最好,最坏,平均时间复杂度均为O(nlogn)。
归并排序算法实现
def merge_sort(li):
"""归并排序算法"""
if len(li) <= 1:
return li
# 使用二分法将数列分两个
mid = len(li) // 2
left = li[:mid]
right = li[mid:]
# 使用递归运算
return merge(merge_sort(left), merge_sort(right))
def merge(a, b):
"""排序合并两个数列"""
result = list()
# 两个数列都有值
while len(a) > 0 and len(b) > 0:
# 左右两个数列第一个最小放前面
if a[0] < b[0]:
result.append(a.pop(0))
else:
result.append(b.pop(0))
# 只有一个数列中还有值,直接添加
result += a
result += b
return result
if __name__ == '__main__':
li = [54, 26, 93, 17, 77, 31, 44, 50, 20]
print('排序前:', li)
mew_li = merge_sort(li)
print('排序后:', mew_li)
运行结果:
python有一个模块,专门提供了归并排序的方法,叫做“heapq”模块,因此只要将分解后的结果导入该方法即可。例如:
示例代码:
from heapq import merge
def merge_sort(li):
"""归并排序算法"""
if len(li) <= 1:
return li
# 使用二分法将数列分两个
mid = len(li) // 2
left = li[:mid]
right = li[mid:]
# 使用递归运算
return merge(merge_sort(left), merge_sort(right))
if __name__ == '__main__':
li = [54, 26, 93, 17, 77, 31, 44, 50, 20]
print('排序前:', li)
mew_li = list(merge_sort(li)) # 这儿输出的对象,所以要转换成列表
print('排序后:', mew_li)
运行结果: