1. 问题背景
如果有能力阅读英文文献,最好还是直接阅读英文的文献。但中文的文献获取信息的速度更快,中文看个大概后,再去看英文版本,原本晦涩的概念就好理解多。并且英文不认识的词句还能通过对比中文的翻译进行学习(对比学习的思想)。
虽然市面上已经有许多的全文翻译的软件,能够很好的在原pdf排版基础上翻译成中文,比如小绿鲸。但是,小绿鲸对于我量子领域的文献,对公式的识别和图表的识别,效果并不好,对于狄拉克符号,或者其他符号会造成翻译错误,排版错误。于是我想,能不能有一个开源翻译软件,能满足下面这些需求:
- 在不改变排版的基础上,翻译成中文,因为要方便地对照(对比学习)
- 要对公式和图表原文有较好的保持
- 要能接入API,不同AI的翻译效果并不相同,我有免费的硅基流动API额度和gemini ai studio的API
- 要支持导入自己的术语库
于是,找到了pdf2zh-next这个项目。
2. pdf2zh-next的部署安装(linux环境)
部署,需要你了解一些conda新建环境,或者python 安装pip包的知识
我们即将要部署的是一个带有GUI界面的版本,并且选择的是wsl的linux环境。
如果你了解conda
conda create -n pdf2zh python=3.10 -y
conda activate pdf2zh
conda install pip -y
pip install -U pdf2zh-next
只需要使用上面四条,新建一个conda环境,在新环境里执行pip install -U pdf2zh-next就好了,所有安装都是自动的。
如果你没有conda
sudo apt update
sudo apt install -y python3 python3-pip
pip3 install -U pdf2zh-next
但最好建议还是用conda,这样可以单独隔离出一个环境。
3. pdf2zh-next 安装后如何启动?
上面两种方式,都能成功安装好pdf2zh-next,并且都不难,关键就是那一条指令pip install -U pdf2zh-next。同样的,启动也就只需要一条指令:
pdf2zh_next --gui
这将会启动一个GUI界面,如果GUI界面没有启动,可以手动访问浏览器http://localhost:7860/
现在项目就已经成功启动了:

4. pdf2zh-next 启动后如何配置使用?
当你成功启动这个GUI界面,现在可以拖入文件上传了,但这时候,还有几个选项要看。

上图这三个选项,如果你没用到,最好不勾选,这里用的DeepSeek3.2 ,是没有推理的模型,所以不勾选。

Rate Limit mode 我在硅基流动看到我的RPM是1000,所以我选择1000,如果你不确定,就选custom默认就好。

自动术语提取功能,"自动术语提取"就是:在你开始全文翻译前/过程中,工具会先从论文里自动找出疑似专业术语/高频短语,再用你选的"术语提取引擎"(这里选的是 SiliconFlow)去把这些术语生成一份候选的术语表(glossary),用来提升全文术语一致性。
如果你已经有自己的术语表,这里就不需要勾选,如果没有,可以先勾选后,得到一份术语表(要在下方高级选项勾选'保存自动提取的术语表'),再手动改完上传(也在高级选项中上传术语表)使用。
术语表的格式(应该是csv格式,这里用纯文本展示,一共三列,分别是source,target,tgt_lng,把 source,target,tgt_lng 作为 CSV 的第一行(表头))
source,target,tgt_lng
quantum machine learning,量子机器学习,zh-CN
quantum computing,量子计算,zh-CN
quantum circuit,量子电路,zh-CN
别忘了点保存设置,这样设置就会被保存到本地,下次就不需要再填写。
输出选项

5.最后一步,翻译

点击翻译后,等待一段时间,就能得到一份pdf了。
翻译完后,所有产生的文件会在下方"已翻译"得到,可以把这些文件下载下来了。

6. 效果展示
提取出的术语表效果展示如下:


费用方面,翻译了一篇8页的内容,大致是0.15元(硅基流动,DeepSeek3.2)
致谢
pdf2zh-next(PDFMathTranslate-next)的 GitHub 仓库:
https://github.com/PDFMathTranslate/PDFMathTranslate-next