📝

macOS Sonomaから使えるようになった日本語縦書きOCRを使ってスクリーンショットの画像の文字を認識する

2023/12/09に公開1

縦書きの例として青空文庫を使います。
https://aozora.binb.jp/reader/main.html?cid=45630

例えば上記のような縦書き文章をスクショしてPreview.appで開きます。

そしておもむろにカーソルを持っていくと…。

このようにテキスト部分を自動で抽出して、コピペできるようになってます!

雨ニモマケズ
風ニモマケズ
雪ニモ夏ノ暑サニモマケヌ
丈夫ナカラダヲモチ
慾ハナク
決シテ|ラズ
...
ワタシハナリタイ

で、今まで以下の記事にあるような方法でOCRは行えたのですが、少なくとも現時点ではそのままで縦書きに対応できませんでした。時間経過でAPIが増えたりすると思うのですが、少なくとも現状では縦書きを認識しないことを確認しました。

https://doratex.hatenablog.jp/entry/20230629/1687977178

ということでmacOSにある機能で縦書きを試してみました!
設定は以下です。手抜きですいませんが、Xのリンクを貼っておきます。

https://twitter.com/kazuph/status/1733238392857702649
https://twitter.com/kazuph/status/1733241517660418426

(あ、通知のタイトルが"タイトル"になっているので、「文字を抽出」等に変更するとわかりやすいですね)

これによって、ショートカットを入力するとすぐに矩形選択してその結果が通知で表示+クリップボードにコピーされた状態になります。

以上です。

Discussion