今天给大家分享一个Python自动化办公的知识:1行代码,批量给把doc文档转为docx格式。
1、上代码
下载Python自动化办公的专用库:python-office,下载命令如下。
pip install python-office -i https:///simple -U
注意,最近清华镜像和阿里镜像都不怎么更新国外源了,不知道是什么原因。
所以,建议大家在条件允许的情况下,像上面的代码那样,使用国外源来下载第三方库,才是最新版~
# pip install python-office 一定要成功哦~
import office
office.word.docx2doc(input_path, output_path)
office.word.doc2docx(input_path, output_path)
2、使用说明
有以下几点使用技巧:
-
input_path:可以填单个文件,也可以填一个路径,会自动搜索路径下所有pdf文件,包括子文件夹里的。
-
待开发功能:有些朋友想根据文件名筛选pdf文档,或者更高阶的想通过正则来筛选。请点赞本文后,在留言区告诉我~
开发这个功能的过程中我一直在想:为什么不能直接改后缀名?求解释!