📖

macOSにDockerでPDFMathTranslateとollamaを入れてPDFの英文を日本語化する

2025/01/17に公開

はじめに

英語で書かれた技術書PDFを日本語で読みたい。英語の原文と併記してほしいと思っていたのですが、それがローカルでできるようになOSSが出てました。

タイトルの通り、macOSにDockerでPDFMathTranslateとollamaを入れてPDFの英文を日本語化するためのsetup方法について書いておきます。とりあえず試したい自分用です。

前提

  • Docker Desktop for macOS

Dockerコンテナは2つ。

どっちから入れるかはどうでもいいですが、ollamaから書いておきます。

ollama/ollama

まずpullします

$ docker pull ollama/ollama

pullできたら次に起動(だいたいMacBookの場合はCPUオンリーだと思います)。

$ docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

実行したDockerコンテナに入ります(次のコマンドじゃなくてもDocker DesktopからでもOpen in terminalで入れます)

$ docker exec -it ollama /bin/bash

コンテナに入るとrootとなってるはずです。そこでとりあえずgemma2を使うためpullする。

# ollama pull gemma2

pullが成功したら次はPDFMathTranslateのコンテナのpullに進みます。

byaidu/pdf2zh

まずDockerコンテナのpull

$ docker pull byaidu/pdf2zh

次にDockerコンテナを実行します。環境変数でOLLAMA_HOSTを指定するのは必須です。

$ docker run -d -p 7860:7860 --name pdf2zh --env=OLLAMA_HOST=http://host.docker.internal:11434 byaidu/pdf2zh

あとはlocalhost:7860にアクセスしてください。

デフォルトGoogle翻訳APIとなってるのでOllamaに変更しTranslate toをJapaneseすれば良いでしょう。

エラー

PDFMathTranslateでconnection refusedのログ

WebのUIでOLLAMA_HOSTを変更しても反映されないので、環境変数で指定するといいはずです。

https://github.com/Byaidu/PDFMathTranslate/issues/234

Discussion