openBD 第1回ユーザーフォーラムを視聴した感想(2022/7/28開催)
書誌情報・書影を、だれでも自由に使える、高速なAPI
openBDプロジェクトの本家サイトに掲げられている、サービスの理念です。
openBD第1回ユーザーフォーラムが2022/7/28に開催され、内容がアーカイブ配信されています。
1 はじめに
1-1 筆者と「IT・本」の関わり&参加した動機
私は仕事として、インターネットのどこかに公開されているWebAPIを開発しています。また趣味では、本を買ったり、読んだりすることが好きです。そうした背景から「出版情報のデジタルデータ提供」のサービスに強い関心がありました。インターネットを検索し、書籍のデータを網羅的に取得できる&自由度の高いサービスはないか調べていたところ、openBDを知りました。
そして今回、ユーザーフォーラムに視聴者として参加しました。私は「少し興味がある」レベルのフォロワーに過ぎませんが、所属を問わず誰でも参加可能という理念が有難かったです。
1-2 この記事について
ユーザーフォーラム参加を通して貴重なインプットを得られたので、記事を書きました。
ここでは第1回ユーザーフォーラムの簡単なメモと、私自身の感想を公開します。これを見てopenBDが気になった方は、ぜひ上記Youtubeのリンクからアーカイブをご覧ください。
1-3 openBD運営関係者様へ
ユーザーフォーラムの開催ありがとうございました。
プロダクトとしてのopenBDの発展と、ユーザー交流の充実を楽しみにしています。
私自身も、openBDの活用をテーマとした技術記事/ソースコードの公開をしてみたい、そして、ゆくゆくは発表者として登壇もできたらなと思っています。
2 ユーザーフォーラムの流れ
- 発表
- 事前アンケート・当日のコメントに基づく質疑応答
3 発表
3-1 発表リスト
(敬称略)
番号 | 表題 | 発表の概要(キーワード) |
---|---|---|
1 | 挨拶(版元ドットコム 沢辺均) | 「提供している本のデータ・書影」「openBD今後の計画」 |
2 | 活用事例1 | 「BookCeller」 |
3 | 活用事例2 | 「BookLink」 |
4 | 活用事例3 | 三重県立津高等学校図書館における「スプレッドシート制作」「ポスター制作」 |
5 | 活用事例4 | 「BookBang」 |
6 | 活用事例5 | 合同会社NOT SO BADのクローズドサービス(※2022年7月の時点でβ版のため。)「モクジー」 |
7 | 活用事例6 | 「近刊検索デルタ」「でる★まん」「重版出来ですYO!」「店頭在庫確認リンク」「vslip」 |
8 | 活用事例7 | 「EBSCO Discovery Service」「EBSCO eBooks」 |
9 | 活用事例8 | 「ALL REVIEWS」「みんなのつぶやき文学賞」「PASSAGE by ALL REVIEWS」 |
10 | openBDの技術的解説と展望(カーリル代表・エンジニア 吉本龍司) | 「速いAPIが欲しい」「長期的なAPI の維持を前提にする」「大規模アクセスへの対応」「みんなでつくる。バージョン2。」 |
3-2 感想① - openBD運営の背景を知ることができた
上表の通り、版元ドットコムの沢辺様と、カーリルの吉本様が、openBDプロジェクト運営側の登壇者として、発表されました。
openBDは2017年公開のサービスです。版元ドットコムの書誌データ収集事業は、2000年からの長い歴史があります。それに対して私がopenBDを知ったのは今年のこと。おふたりのお話は、背景の理解に大変役立ちました。
データベース収集:版元ドットコム
【発言ピックアップ(沢辺様)】
- データの元ネタは「版元ドットコム+JPRO+TRC+左記に該当しない地方小出版社等のデータ」で、高い網羅率を実現している。
- 知ってほしい版元ドットコムの機能
- openBDとして検索用APIを提供する予定はない。データベースがほぼ同じである「版元ドットコム」のサイトで、詳細検索機能を使ってほしい。
- 版元ドットコムの書誌ページには便利な機能があるので、もっと知られてほしい。
- openBDの提供データに間違い(出版社側のケアレスミス起因)が多いと言われるが、ぜひ「間違いを指摘する」リンクからフィードバックしてほしい。
- 「書誌情報のコピー」ボタン(赤い真四角のボタン)がある。このボタンは検索結果一覧にも表示されている。
- 書影をクリックすると「原寸サイズの書影」のダウンロードリンクを押せるようになる。
- 出版社のWebサイトからクロールで書影を取得する機能をリリースする予定。クロール取得を断りたい出版社向けに、停止申請をするためのフォームも用意する。
- 後日(2022/8/1)発表されたこちらのニュースと同件である模様です。(【新文化】 - openBD、10月から出版社サイトでの書影取得スタートへ)
- 今後:書誌・書影の網羅率を上げる。利用者と交流する。
API配信:カーリル
【発言ピックアップ(吉本様)】
- 元々は自分たち(カーリル)で使用する本の情報がほしくて開発したサービスだった。
- 高速であることを重要視している。1ミリ秒以下の応答が目標で、実際には中央値6ミリ秒でデータ返却ができている。なお、パラメータのISBNの指定「1件」でも「1万件」でも、1リクエストとしてカウントをする集計方法が、実測値に影響していると補足あり。
- ソフト面の工夫:複数言語を使用して完全互換アプリを並行開発している。今は最も早いGo版をリリースしている。
- 基盤面の工夫:クラウドサービスのスケーラブルな機能を活用している。アクセス数やアクセス元地域(海外)に対応した高速化を意識している。
- レスポンス値のJSONの構造を破壊的に変更する類のバージョンアップはしない。利用者側のアプリに改修を強制せず、ずっと使えるAPIを維持する。
- 利用方法の相談はよく受けており、性能面を気にしての問い合わせも多い。1日のリクエスト件数増加(ex.200万→2000万)については影響を受けないようにできている。注意が必要なのは一時点の同時アクセス数増大(ex.100万接続の同時リクエスト)で、その時の応答速度が遅くなる。
- 今後:基盤を強化し、早く、美しく(書影)データを提供する。利用者と交流する。
3-2 感想② - openBDが今後も成長し続けていくことを確信した
版元ドットコムとカーリルの共通の方針として「利用者と交流し、バージョンアップに取り入れていく」と表明がありました。今回のユーザーフォーラムは「利用者との交流」を実現したものです。
活用事例を発表した利用者の方々が、アクティブな状態で開発を継続していることもよく分かりました。私はopenBDに触れ始めたばかりですが、運営側と利用者側の活動がこれだけ活発なプロジェクトであることを、とても心強く感じました。
4 質疑応答
4-1 現状、参考になったこと
私も1件質問させていただきました。
性能面に考慮した書誌情報取得処理はどう実装すればよいか?
個人的にDBサーバをローカルに構築して、書誌全件を保存してみたいが、気を付けることはあるか。大量のデータ取得を実行することになるが、openBDのリソースに悪影響を与えない実装方式をうかがいたい。
という質問です。(実際に送った文章とは異なりますが、上記の主旨の質問をコメントで送りました。)
回答
カーリル吉本様より、ご自身が書いた「openBDのデータをすべてダウンロードするツール」の設計を見て、参考にしてくださいという回答をいただきました。
恐らく30秒程度で全書誌情報のレスポンスを受け取れるそうです。※ただし、受け取ったレスポンスを加工し、保存する処理の実行時間等が上乗せされる。
有難うございます!
4-2 今後、勉強したいこと&気になった情報
私は出版業界のデータ活用事情について、まだまだ勉強不足です。アーカイブや参加者向け資料を見返しながら情報収集して、理解を深めたいと思います。
- 書影の著作権。
- Web業界では「背表紙の書影」の需要が高まっている。
- 2000年代よりも前の古い出版情報。
- 出版業界のコード体系。
- 図書館のデータの活用。
- 著者の同定。出版社の同定。
- 業者によって概念が違う値(出版年月日など)
- WebAPIの利用は開発に慣れていない人には難しく、リファレンスが充実するといい。→openBDプロジェクトのサイト内コンテンツの拡充に期待。
5 おわりに
私の業務内容は出版業界と関わるものではなく、今後関わっていくかどうかも分かりませんが、個人活動の題材としてopenBDには強い興味を抱いています。
いつか、利用者としての活動報告を発表できればと思います。
Discussion