成都 网站备案 幕布拍摄点,wordpress讨论吧,横峰网站建设,酒泉网站建设培训分享一个非常实用的PDF文档翻译项目——PDFMathTranslate。作为一个经常逛GitHub的开发者#xff0c;我总喜欢翻看各种项目附带的论文#xff0c;虽然大多时候是瞎研究#xff0c;但却乐在其中。该项目能够完美保留公式、图表、目录和注释#xff0c;对于需要阅读外文文献的…分享一个非常实用的PDF文档翻译项目——PDFMathTranslate。作为一个经常逛GitHub的开发者我总喜欢翻看各种项目附带的论文虽然大多时候是瞎研究但却乐在其中。该项目能够完美保留公式、图表、目录和注释对于需要阅读外文文献的同学来说绝对是一个利器(外语好的当我没说哈) 先来看看效果这是我用GitHub - memoavatar/memo: Memory-Guided Diffusion for Expressive Talking Video Generation该项目的论文进行翻译的结果。
论文链接https://arxiv.org/abs/2412.04448 效果非常不错当然你不仅可以用它翻译论文任何PDF内容都支持。 只支持PDF如果是word等其他格式的需要转成PDF格式来进行处理 本地部署
如果想在本地部署开发有以下几种方式要用整合包可以跳过这部分。
命令行方式
pip install pdf2zh
pdf2zh document.pdf
图形界面方式
pip install pdf2zh
pdf2zh -i
然后在浏览器打开 http://localhost:7860 即可使用。
Docker部署
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh 进阶功能
部分翻译如果只需要翻译特定页面可以使用 -p 参数
pdf2zh example.pdf -p 1-3,5
自定义语言支持指定源语言和目标语言
pdf2zh example.pdf -li en -lo ja
选择翻译服务可以根据需求切换不同的翻译服务
pdf2zh example.pdf -s openai:gpt-4
快速上手
最简单的使用方式是访问官方提供的在线服务PDFMathTranslate - PDF Translation with preserved formats
无需安装任何东西直接上传PDF即可获得翻译结果。 需要注意的是在线服务考虑到服务器压力上传的PDF文件大小不能超过5M。如果要翻译大于5M的咱们建议还是用整合包或者本地部署。 简单说下使用方法没什么难度。 类型
类型这里有两种选择一种是直接上传本地的PDF文件。 一种是直接复制链接进去。
例如https://arxiv.org/pdf/2412.04448 翻译服务
这里选择对应的翻译服务 需要注意的是某些翻译服务需要用到API需要到对应的平台上去申请。 翻译语言设置
这个也不用过多介绍 可以看到支持的语言列表 页面范围
翻译的范围。对于大型PDF文档建议先试译几页看看效果 批量处理
在使用的时候考虑到有时候不是一个文档需要翻译但是每次都要设置然后来回点击也挺麻烦的。 于是我动动手加了批量功能。 可以添加多个PDF进行处理。 处理好的文件点击打开默认输出文件夹即可找到 一个pdf会生成三个文件。 2412.04448v1原文件。
2412.04448v1-zh翻译后的文件。
2412.04448v1-dual翻译后的双语文件。 需要注意
翻译服务中例如谷歌、必应、DeepL、Azure等国外服务需开启对应的网络环境。
配置要求
WIN
WindowsN卡需2G显存
如果整合包运行报错需要安装cuda12.4或cuda11.8
https://developer.nvidia.com/cuda-12-4-0-download-archive
MAC
MAC Apple Silicon M1/M2/M3/M4 芯片
2G内存 整合包获取 下方下方下方
https://pan.quark.cn/s/a34b907537f0
https://pan.baidu.com/s/1Q8F3dFg1XUxCOD_O_QuuoQ?pwdbzzv 如果发了关键词没回复你记得看下复制的时候是不是把空格给粘贴进去了 制作不易如果本文对您有帮助还请点个免费的赞或在看感谢您的阅读