提取文档文本
# 提取Word文档中的所有文本
def extract_text_from_document(file_name):
doc = Document(file_name)
text = []
for para in doc.paragraphs:
text.append(para.text)
return '\n'.join(text)
extracted_text = extract_text_from_document('example.docx')
print("提取的文本内容如下:")
print(extracted_text)
解释
该脚本提取Word文档中的所有文本内容并打印出来。这在需要分析或总结文件内容时非常有用,尤其是在从大量文档中提取关键数据时。
保存文档副本
# 保存Word文档的副本
def save_document_copy(original_file, copy_file):
doc = Document(original_file)
doc.save(copy_file)
save_document_copy('example.docx', 'copy_of_example.docx')
print("文档副本已成功保存!")
解释
此脚本保存Word文档的副本,便于备份和版本控制。在处理重要文件时,定期保存副本是保护数据的重要措施,特别是在进行大规模修改之前。