🐥

Google Colabを用いたgcv2hocrの実行例：Google Vision APIを用いた透明テキスト付きPDFファイルの作成

2022/05/03に公開

概要

gcv2ocrは、Google Cloud Vision OCR出力からhocrに変換して、検索可能なpdfを作成するリポジトリです。

今回、上記リポジトリをGoogle Colabで実行するノートブックを作成しました。

以下のように、検索可能なpdfファイルを作成することができます。

以下のノートブックにアクセスします。

まず、Google Cloud Vision APIを使用するためのAPIキーを取得します。以下の記事などが参考になります。

APIキーを入力したら、以下の初期セットアップに関する3つの再生ボタンを押します。

その後は、以下に示す実行オプションから、適切なものを選択します。

例えば、「画像のURL」を指定する場合、以下に示す「設定」と「実行」の2つの再生ボタンを押します。

実行後、PDFファイルがダウンロードされます。また、認識結果等が出力されるパスが表示されます。

gcv2ocrやhocr-toolsなど、便利なツールを開発してくださった方々に感謝いたします。