BabelDOC:无损排版,海量额度
BabelDOC 是新一代智能 PDF 翻译工具,采用先进的排版保持技术,为您提供专业级的双语对照翻译体验。无论是前沿学术论文,还是商业分析报告,BabelDOC 都能帮您轻松跨越语言藩篱,同时完美呈现原文档的精致排版。
BabelDOC 已正式开源,项目托管于 GitHub。欢迎访问项目仓库,为我们点亮一颗 Star,共同支持这个开源项目!
精准双语对照,原汁原味呈现
采用智能版面分析技术,精确识别文档结构与段落布局。译文与原文智能对齐,让您在阅读时可以即时对照,大幅提升阅读效率和理解准确度。

智能公式文本混排
采用公式识别技术,完美处理数学公式与文本的复杂混排场景。公式内容原样保留,文本部分智能翻译,确保学术文献的专业性和准确性。

原生样式完美呈现
采用先进的样式映射技术,完整保留原文档的字体、颜色、间距等设计元素。支持标点悬挂、自适应缩放等专业排版特性,确保翻译后的文档依然保持原有的精致美感。

复杂排版智能处理
采用深度学习布局分析技术,从容应对多栏布局、表格、列表等复杂排版形式。无论文档结构如何繁复,都能精准识别并优化翻译,完美还原原有版式布局。

常见问题
如何在 Zotero 中使用 BabelDOC 翻译 PDF?
您可以前往 Zotero 沉浸式翻译插件 仓库,并根据 README 文档说明安装插件使用。(当前仅 Pro 会员可用)
最佳应用场景
- 学术论文翻译:期刊论文、会议论文、研究报告等
- 电子书籍:书籍、技术手册等(表格占比较低的)
暂不适用的场景
- 扫描版 PDF:包括 OCR 处理过的文档
- 学术投稿:不建议直接用于论文投稿
使用的翻译服务
所有用户目前均可免费使用 GLM-4-Flash-250414 模型进行翻译,而 Pro 用户还可额外选择使用 DeepSeek-V3/Doubao-1.5-pro/GLM-4-Plus/GPT-4.1-mini/Gemini-2.5-Flash 模型进行翻译。
BabelDOC 的技术优势
BabelDOC 在 PDF 翻译领域具有以下核心优势:
- 精准排版还原:独特的版面分析技术,完整保留原文档的排版细节,包括字体、颜色、间距等
- 智能公式处理:先进公式识别技术,确保数学公式与文本的完美混排
- 专业领域优化:针对学术论文等专业文献进行特殊优化,提供更准确的翻译效果
翻译额度说明
我们目前采用“解析页数 + 翻译额度”相结合的计费方式,具体说明如下:
解析额度
- 实验期间,所有用户每月可享受 1000 页免费解析额度,但可能会根据服务器负载动态调整。
- Pro 试用会员每月可享受 2000 页解析额度。
- Pro 会员每月可享受 10000 页解析额度(限期优惠)。
- 解析额度会在每月初 自动重置。
翻译额度
- 翻译额度按照翻译过程中使用的 Token 数量 进行计费。
- GLM-4-Flash-250414 模型免费,所有用户均可使用。
- DeepSeek-V3/Doubao-1.5-pro/GLM-4-Plus/GPT-4.1-mini/Gemini-2.5-Flash 模型仅限 Pro 会员使用,计入 Pro 会员通用翻译额度,每月可享受 高达 2000 万 Token 的翻译额度。
- 失败的翻译不计入翻译额度。
在翻译任务启动时,系统将根据"3000 Token × 翻译页数"的计算方式预先扣除相应的通用翻译额度。待翻译完成后,我们将按实际消耗进行结算,多余额度将退还至您的账户,不足部分则需补充。若翻译过程中遇到任何系统错误,所有预扣的通用翻译额度将自动全额返还至您的账户。
当不启用自动提取术语时,单页预扣 Token 数为 3000 Token/页。当启用自动提取术语功能时,单页预扣 Token 数为 6000 Token/页。
翻译性能说明
BabelDOC 采用并行处理技术,处理速度因文档特点而异:
- 50 页左右文档:通常 1-5 分钟完成
- 500 页左右文档:约 10-20 分钟完成
- 1000 页左右文档:约 10-20 分钟完成
- 5000 页左右文档:约 1-2 小时完成
- 处理时间受文档复杂度、服务器负载等因素影响
并发任务数说明
单个文件翻译:所有用户在使用“单个文件”翻译功能时,系统仅支持同时进行一个翻译任务。
批量翻译(Pro 会员专属):Pro 会员可享受批量翻译功能,最多可同时排队 100 个翻译任务(限期测试)。虽然批量翻译任务的处理优先级低于单个文件翻译,但此功能允许您一次性提交并翻译大量文件,提高工作效率。
在系统负载较高的高峰时段,我们会优先保证 Pro 会员的单文件翻译任务处理速度,确保会员获得更佳的使用体验。单个文件翻译和批量翻译的任务数独立计算。
关于翻译记录保留时间
我们会为您免费保留翻译记录及相关文件 14 天。
超过 14 天后,您的翻译记录和文件可能会因系统缓存清理等原因被自动删除,无法恢复。请您在有效期内及时保存或下载所需文件,以免造成不便。
文档限制说明
- 免费用户单次翻译上限为 500 页,Pro 会员单次翻译上限提升至 5000 页
- 超过页数限制时,可手动选择翻译范围(如 1-500 页)
使用技巧
- 双语对照显示:将 PDF 阅读器设置为双页显示模式即可实现双语对照阅读
- 翻译进度说明:生成 PDF 文件时会进行字体子集化和绘制指令优化,可能需要较长时间,请耐心等待
- 最佳实践:建议先用小篇幅文档测试,熟悉工具特性后再处理大型文档
已知限制
当前版本存在以下限制,我们正在积极优化:
- 部分公式段落可能出现重叠
- 不支持线条元素处理
- 小型段落(如作者信息、引文、目录条目等)可能识别不准
- 不支持图表区域翻译
- 不支持首字下沉效果
- 不支持 PDF Outline 翻译
- 不支持扫描版、图片版及 OCR 版 PDF
- 不支持连字
- 不支持图纸
- 不支持使用 Type3 字体
BabelDOC 与 沉浸式翻译现有 PDF 翻译有什么区别
BabelDOC 与沉浸式翻译在 PDF 处理方面有以下主要区别:
- 排版保留:BabelDOC 专注于完整保留原文档的排版,包括字体、颜色、间距等细节,而不是重排。
- 公式混排支持:BabelDOC 能够智能处理数学公式混排,确保公式与文本的混排效果。
- 专业领域支持:特别优化了学术论文等专业文献的翻译效果。
翻译效果不如预期
当前 BabelDOC 仍处于早期开发阶段,翻译效果可能不如预期,我们正在努力改进中。如果您碰到问题,请通过翻译结果页面右上角的问题反馈按钮反馈,我们将在第一时间改进。
为什么导出 PDF 很慢
因为在最后导出 PDF 时需要执行绘制指令清理,这个操作需要消耗比较多的时间,所以会出现卡顿的情况。请您耐心等待。
什么时候需要启用兼容模式?
在未启用兼容模式,且译文出现以下情况时,您需要启用兼容模式:
- 彩色色块变成黑色且影响阅读
- 整页文字突然消失
- 部分论文每个字中间都有一个空格
启用兼容模式的影响是什么?
启用兼容模式后,BabelDOC 将禁用富文本翻译、跳过字体子集化、文档清理和绘制指令优化步骤,从而导致文件体积增大。
为什么翻译后的文件译文和原文叠起来了
这是因为原始文件是 OCR 后的扫描版 PDF,您可以尝试启用 OCR 版临时解决方案重新尝试(仅支持白底黑字 PDF)
什么时候需要启用 OCR 版临时解决方案?
当您的扫描/图片版 PDF 文件已进行 OCR 处理,且为白底黑字时,可以尝试启用 OCR 版的临时解决方案。该方案将在译文下方添加白色矩形块,以覆盖原文内容。