python学习- 打印最常用的10条linux命令和查找目录下重复的文件-天翼云

python学习- 打印最常用的10条linux命令和查找目录下重复的文件

2023-04-27 06:28:41 阅读次数：140

一、打印最常用的10条linux命令

#!/usr/bin/python
#coding=utf-8
import os
from collections import Counter
c = Counter()
with open(os.path.expanduser('~/.bash_history')) as f:
	for line in f:
		cmd = line.strip().split()
		if cmd:
			c[cmd[0]]+=1
print c.most_common(10)

效果如下：

python学习- 打印最常用的10条linux命令和查找目录下重复的文件

二、找到目录下重复的文件

#!/usr/bin/python
#coding=utf-8
from __future__ import print_function
import sys
import hashlib
import os
import fnmatch

CHUNK_SIZE=8192
def is_file_match(filename,patterns):
	for pattern in patterns:
		if fnmatch.fnmatch(filename,pattern):
			return True
	return False

def find_specific_files(root,patterns=['*'],exclude_dirs=[]):
	for root,dirnames,filenames in os.walk(root):
		for filename in filenames:
			if is_file_match(filename,patterns):
				yield os.path.join(root,filename)
				for d in exclude_dirs:
					if d in dirnames:
						dirnames.remove(d)	

def get_chunk(filename):
	with open(filename) as f:
		while True:
			chunk=f.read(CHUNK_SIZE)
			if not chunk:
				break
			else:
				yield chunk


def get_file_checksum(filename):
	h=hashlib.md5()
	for chunk in get_chunk(filename):
		h.update(chunk)
	return h.hexdigest()

def main ():
	sys.argv.append("")
	directory=sys.argv[1]
	if not os.path.isdir(directory):
		raise SystemExit ("{0} is not a directory".format(directory))
		 
	record={}
	for item in find_specific_files(directory):
		checksum=get_file_checksum(item)
		if checksum in record:
			print ('find duplicate files: {0} vs {1}'.format(record[checksum],item))
		else:
			record[checksum]=item

if __name__ == '__main__':
	main()

效果如下：

python学习- 打印最常用的10条linux命令和查找目录下重复的文件

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

python学习- 打印最常用的10条linux命令和查找目录下重复的文件

python学习- 打印最常用的10条linux命令和查找目录下重复的文件

相关文章

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

视频 | Python测试开发之调试print代码实例

python简单介绍及基础知识（一）

使用Python扩展PAM（part 2）

1行Python代码，把Excel转成PDF，python-office功能更新~

IronPython 与 c# 交互之导入Python模块的两种方法

python性能测试之pyperformance

Python高维统计建模变量选择:SCAD平滑剪切绝对偏差惩罚、Lasso惩罚函数比较

一篇文章教会你Python中三种简单函数的使用

一篇文章带你剖析Python 字节流处理神器struct

作者介绍

最新文章

【python基础】学习路线

python实战三：使用循环while模拟用户登录

python递归遍历路径下的所有文件和文件夹

仅用pygame+python实现植物大战僵尸-----完成比完美更重要

Flask 实现用户登录功能的完整示例：前端与后端整合（附Demo）

python——偏函数的使用

热门文章

Linux crontab 任务误删恢复及备份步骤

Linux 趣味小知识--软硬连接以及应用

Linux常用命令总结

linux-压缩与解压缩

linux基本命令（47）——iostat命令

python list转dict

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

常用命令--chmod--chown--区别

python学习-使用pandas 按照行数分割表格

linux之vi/vim使用

python保存float类型中小数的位数

Linux 的安装

leetcode（python版本）-第2题-两数相加