锦州市网站建设_网站建设公司_HTML_seo优化
2025/12/17 11:51:42 网站建设 项目流程

摘要:还在一个个打开Word点击“另存为PDF”?本文教你使用Python的docx2pdf库,仅需3行代码,即可瞬间完成成百上千个文档的格式转换。无废话,直接上实战。


0. 为什么写这篇文章?

昨天快下班时,同事发来一个文件夹,里面有50份合同(.docx),需要全部转成PDF发给客户。如果手动打开->另存为->关闭,至少需要半小时,还容易手抖点错。

使用Python,这只是30秒的事情。

1. 环境准备

我们需要用到一个神器库:docx2pdf

前置条件:

  1. 电脑上安装了 Python 3.x。

  2. 电脑上安装了 Microsoft Word(因为该库在Windows下调用Word的COM接口,在Mac下调用JXA)。

安装命令:

打开终端(CMD/PowerShell/Terminal),输入:

Bash

pip install docx2pdf

2. 实战演练

场景一:转换单个文件

如果你只想转换一个特定的文件,代码非常简单。

新建文件one_file.py

Python

from docx2pdf import convert # 语法:convert("原文件路径", "目标文件路径") convert("offer_letter.docx", "offer_letter.pdf") print("转换完成!")

场景二:批量转换整个文件夹(核心实战)

这是最常用的场景。你只需要指定文件夹路径,脚本会自动识别里面所有的.docx文件并将其转换为PDF,保存在同一目录下。

新建文件batch_convert.py

Python

from docx2pdf import convert import os # 定义你的文件夹路径 (Windows下注意路径中的斜杠) folder_path = r"C:\Users\Admin\Desktop\Contracts" print(f"开始转换文件夹: {folder_path} ...") # 一行代码搞定整个文件夹的转换 convert(folder_path) print("所有文件转换完毕!")

注意:Windows用户建议在路径字符串前加r,防止转义字符报错。


3. 进阶:带进度条的转换(看起来更专业)

虽然上面的代码能用,但如果文件很多,我们想知道进度怎么办?docx2pdf自带进度条显示,但如果我们想结合tqdm(Python最美进度条库) 自己写逻辑,可以这样控制:

安装 tqdm:

Bash

pip install tqdm

完整代码:

Python

import os from docx2pdf import convert from tqdm import tqdm def batch_convert_with_progress(target_folder): # 获取文件夹内所有docx文件 files = [f for f in os.listdir(target_folder) if f.endswith('.docx')] if not files: print("该目录下没有Word文档。") return print(f"共发现 {len(files)} 个文件,准备开始转换...") # 使用进度条循环 for filename in tqdm(files, desc="转换进度"): docx_path = os.path.join(target_folder, filename) pdf_path = os.path.join(target_folder, filename.replace(".docx", ".pdf")) # 转换单个文件 try: convert(docx_path, pdf_path) except Exception as e: print(f"文件 {filename} 转换失败: {e}") if __name__ == "__main__": # 替换为你自己的文件夹路径 my_folder = r"C:\Users\Admin\Desktop\TestFiles" batch_convert_with_progress(my_folder)

运行效果:

你会在控制台看到一个动态的进度条,实时显示处理了多少个文件。


4. 避坑指南

在实战中,可能会遇到以下两个常见问题:

  1. 报错CoInitialize has not been called

    • 原因:通常发生在多线程操作中。

    • 解决:本文的单线程脚本一般不会出现。如果出现,只需使用pythoncom.CoInitialize()初始化即可。

  2. Word卡死或报错

    • 原因:转换过程中请不要手动打开Word文档,否则会冲突。

    • 建议:运行脚本前,关闭所有Word窗口。


5. 总结

别再做“文档搬运工”了。通过docx2pdf库:

  • 1行代码convert("文件夹路径")即可实现批量转换。

  • 0 理论:不需要了解底层的PDF编码原理。

  • 100% 效率:留出更多时间去学习新技术(或者摸鱼)。

赶紧把这个脚本保存起来,下次遇到批量任务时直接运行!


下一步建议

您希望我为您提供关于“如何使用 Python 自动发送带附件的邮件”的教程吗?这样就可以实现“自动转换 -> 自动发送”的全自动化流程了。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询