🔍

日本語特化の文書画像解析・OCRライブラリ「Yomitoku」を試してみる

2024/11/30に公開

概要

先日Twitterで見かけた日本語特化の文書画像解析・OCR Pythonパッケージが面白そうだったので使ってみました。(商用利用は別途ライセンスを申請する必要があるためご注意ください)
https://x.com/KINOCOAI/status/1861386062175838303
https://github.com/kotaro-kinoshita/yomitoku

環境

  • OS: Windows11
  • CPU: Intel Core i7-1265U
  • GPU: なし
  • メモリ: 16 GB

インストールと実行

インストールとテスト実行が2stepで完了するのでありがたいです。

$ pip install yomitoku
$ yomitoku <input_file> -f md -o results -v --figure 
  • 執筆時のバージョン: v0.5.1 (beta)
  • オプション: 各オプションはREADMEでご確認ください。

結果

開発者様が表分析について処理例を出してくださっていたので、画像を含む2段組み論文のように処理が難しそうなものに対しての性能を確認しました。情報科学技術協会様が出版している会誌「情報の科学と技術」から「AIサービスを活用した知財情報解析を含む競合調査の提案」という記事を使わせていただきました。

  • 処理時間: 373.60 sec / 5 pages

結果 1

レイアウト分析結果

最初にタイトルと概要が1段で書かれ、その後に2段組みの文章が来て、さらに左下に脚注があるようなものも問題なくレイアウト抽出と読む順番の予測ができていました。すごい。

OCR結果

日本語特化ということでOCRも全く問題なさそうです。すごい。

出力マークダウン全文

連載:特許情報分析/解析/検索データベース 第2回

AI サービスを活用した知財情報解析を含む競合調査の提案

大瀬 佳之*

近年 ChatGPT を代表とする, AI ツールの様々な業務への適用が注目を浴びている。本稿では、競合調査において AI ツールと特許情報
解析ツールを上手に組み合わせて活用することにより、高価な情報サービスを利用することなしに、効率的に充実した競合調査を実現す
る方法を提案する。競合調査は、知財戦略の立案や、企業の競争優位性の確保にとって重要である。従来、特定の大企業のみが実行可能
であった大規模な情報収集,情報調査といったものが、AI ツールや特許情報解析ツールを組み合わせて活用することにより,中小企業,
スタートアップ等でも実行可能になりつつあると考える。

キーワード:特許,知財,競合調査

本稿は、 クリエイティブ·コモンズ表示 4.0 国際(CC BY 4.0) ライセンスの下に提供する(https://creativecommons.erg/licenses/by.4.0/dee
QQ

1. はじめに

近年,企業活動において戦略的に知財活動を推進する重
要性が高まってきている。戦略的な知財活動の推進には,
知財戦略を策定する必要があり,戦略策定には競合企業の
動向調査が必要不可欠である。競合企業の動向調査の内容
には、特許,商標を代表とする知財情報が含まれている。
また、企業情報はインターネットを介して手軽に調べられ
ることから、競合企業分析を行うにあたり、知財情報以外
の一般情報を組み合わせて競合企業調査を行うことが一般
的である。

特に,最近は,OpenAI 社の ChatGPT1) を一例として,
実際の調査実務において活用可能と思われる汎用的な人工
知能サービスが登場してきた。このように、知財情報を含
む競合企業調査において、情報解析を短時間で効率的に行
うための環境が整いつつある。

本稿では、近年注目を浴びている AI ツールについて紹
介するとともに、弊社が提供する特許情報解析サービスで
ある「パテント·インテグレーション」と組み合わせて,
競合企業調査への活用方法を提案する。

本稿は、主に新規事業企画部門,事業戦略部門,知財部
門等に所属しており、自社事業の強化のための各種戦略立
案,戦略提言,競合企業調査などに従事している方々を対
象としている。特に、これから新たに特許情報解析や分析
系業務に取り組みたいと考えている方に役立つ内容であ
る。

2. 知財戦略と競合調査

知財戦略は、企業が持つ知的財産権を戦略的に活用する
ことで、企業価値の向上や競争力の強化を図るものである。
知財戦略は事業戦略に従って策定されるものであるが、事

業戦略の策定と同様に,市場分析(消費者の嗜好や購買行
動,市場規模や成長率,競合他社に関する分析),政治·
経済状況,社会情勢,技術動向,規制環境の変化などに基
づく経営環境の変化,顧客ニーズの変化,技術動向等の多
面的な観点から行われる。

戦略策定は、自社の他社に対する事業上の競争優位性を
確保することが目的であることから、特に競合企業の事業
動向,技術動向を調査する競合調査は必要不可欠であると
いえる。競合調査は、競合企業の情報を収集·分析し,自
社の競争力向上や事業戦略の適正化に役立てるものであ
る。競合調査には、知財情報が含まれており、自社の知財
戦略の構築や競合優位性の確保の観点から重要なものであ
る。

競合調査においては、競合企業の技術動向や知財戦略を
把握し,自社の知財戦略に反映させることが重要である。
例えば、競合企業の特許や商標の出願状況や出願内容を把
握することで、自社の研究開発やマーケティング戦略に役
立てることができる。市場での競合企業の動向を調査する
ことにより、自社の競争優位性の強化に役立てることがで
きる。

競合調査は、アンケート調査,インタビュー調査,実際
に競合製品の購入等を行う他に, Google 等のインター
ネット検索エンジンを活用した情報収集,情報調査が手軽
に行うことができるため広く一般的に行われている。一
方,近年,汎用的な AI ツールが登場してきており、競合
調査業務に対してインターネット検索エンジンの登場に匹
敵する影響を与えることが予想される。以下は、主な AI
ツールとその機能を紹介するとともに、競合調査および知
財戦略等の業務への活用を提案する。

3. Al ツールの説明

3.1 OpenAl ChatGPT

ChatGPT は, OpenAI 社が開発した言語モデルであり,
対話形式のチャットボットとして提供される。ChatGPT
は、様々な質問に対して優れた回答を行うサービスとし

*おおせ よしゆき パテント·インテグレーション株式会社
〒102-0074 東京都千代田区九段南1-5-6りそな九段ビル5F
(原稿受領 2023.3.15)
E-mail: ose@patent-i.com

- 187 -

情報の科学と技術 73巻5号,187~191 (2023)

マークダウン出力もできます。改行が<br>として出力されていますが、--ignore_line_breakのオプションを付けることで段落内の文章を連結して返すことができるようです。すごい。

結果 2

レイアウト分析結果

文字を含む画像が含まれる場合も問題なくレイアウト分析できています。

OCR結果

手書き文字はサポート対象外ということですが、画像に含まれる活字であれば問題なく読み取れています。

出力マークダウン全文

<img src="figures/yomitoku_AIサービスを活用した知財情報解析を含む競合調査の提案_p3_figure_0.png" width="200px">

図1 競合調査に対する興味関心の洗い出し(2023年3月12日)

<img src="figures/yomitoku_AIサービスを活用した知財情報解析を含む競合調査の提案_p3_figure_1.png" width="200px">

図2 競合調査の目的,レベル設定に対する助言(2023年3月12日)

例えば,図1は、「新規事業企画のマネジャーは競合調
査に対してどのような興味関心があるのか?」の問いに対
する回答である。このように,報告相手がどのような調査,
分析に興味関心があるのかを明確にすることができる。ま
た、検討項目に抜け、漏れがないように簡単に項目を洗い
出すことができる。

4.2 競合調査の目的,レベル設定に対する助言

競合調査の目的の明確化,競合調査内容のレベル設定を
行うにあたり AI ツールに助言を求めることができる。

例えば、図2は、「研究開発部門へ競合調査を報告する
にあたり,行動させるための工夫」についての助言を求め
る問いに対する回答である。このように、汎用的な質問に
対する助言を得ることにより,調査内容,調査方針を簡単
にブラッシュアップすることができる。

<img src="figures/yomitoku_AIサービスを活用した知財情報解析を含む競合調査の提案_p3_figure_2.png" width="200px">

図3 競合企業のリストアップに関する助言(2023年3月12日)

4.3 競合企業のリストアップに関する助言

競合企業をリストアップする際にも AI ツールによる助
言は効果的である。

例えば、図3は、「歯科衛生材料を使った新規事業開発
の競合企業」についての助言を求める問いに対する回答で
ある。競合企業の洗い出しに活用することができる。

4.4 競合企業,業界動向の情報収集

AI ツールは、個別企業の情報収集のほか、技術分野,
業界ごとに起きたイベント等を短時間で調査するのに活用
することができる。但し、提示される情報には間違いが含
まれていることが少なくなく、この点については競合調査
のヒントなどあくまで助言として留めておいた方が現時点
では無難である。また、現状 ChatGPT の学習データは
2021 年末までの情報しか含まれていないため、情報が古
い点についても気をつける必要がある。

5. 特許情報の調査·収集·解析

現在,弊社は,リーズナブルな料金設定で、特許検索か
ら特許解析までワンストップで行うことができる特許情報
サービス「パテント·インテグレーション」10) を提供して
いる。

ChatGPT に代表される AI ツールは、特許情報に対し
て十分対応できていない課題がある。例えば、汎用的な
AI ツールは特許分類などを適切に扱うことができない。
特許に関する回答内容も不正解であることも多く特許情報
の調査,解析には適していない。特許情報の調査,解析に
ついては既存の特許情報サービスを組み合わせていくこと
が現実的であると考える。

具体的に,汎用的な AI ツールと,弊社が提供する特許
情報サービスを組み合わせることにより、低コストで特許
情報を含めた競合調査環境を整えることができる。

- 189 -

情報の科学と技術 73巻5号(2023)

ページ内の画像はトリミングして画像として保存されています。レイアウトやOCRでは画像内の文字も処理されて正確に読み取れていそうでしたが、ここではMD内の文章としては出力されていません。
--figure_letterのオプションを付けることで検出した図表に含まれる文字も出力できます。

感想

非常に簡単に精度よく使える上に、かゆいところにも手が届いている印象を受けました。今回はPDF出力された文書ファイルでしたが、写真や手書き文字でどの程度の精度が出るのかも試してみたいです。またGPUなしでも小さいPDF程度であれば時間はかかりますが問題なく処理できましたが、GPUありの環境でも試してみたいです。
商用ライセンスは有償なため個人利用の範囲でまた使ってみようと思います。

ヘッドウォータース

Discussion