📝

学術機関リポジトリにない卒業論文がGoogle Scholarの検索結果に載った

2022/06/09に公開

※2021年にnoteに書いた内容に加筆

以前、学術機関リポジトリに掲載がない論文のGoogle Scholarへの掲載について以下のようにまとめた。

書誌情報のない卒業論文(学士論文)が学術機関リポジトリに掲載されている点から、Google Scholarでの検索結果表示には少なくとも大学や各種学会などの機関リポジトリへの掲載が必要なのだろうと考えた。
出典:note - RuinDig(2020年7月23日)『機関リポジトリに掲載がない論文のGoogle Scholarへの掲載を目指した過程の記録とGoogle Scholarでの検索からの考察』
https://note.com/ruindig/n/nde7baf2701d5, 2021年5月17日参照。

それから半年以上、Google Scholarに自分の卒業論文が載るか調べていなかったが、2021年5月15日にGoogle Scholarで検索すると卒業論文のPDFが出てくるようになっていた。

Google Scholarでの検索「内田悠貴」
Google Scholarでの検索「内田悠貴」

Google Scholarでの検索「Ingress 観光振興」
Google Scholarでの検索「Ingress 観光振興」

Google Scholarでの検索「Ingress 横須賀市」
Google Scholarでの検索「Ingress 横須賀市」

Google Scholarでの検索「イングレス」
Google Scholarでの検索「イングレス」

いずれも検索にはGoogle Chromeのシークレットブラウザを使用。検索ワードは「内田悠貴」「Ingress 観光振興」「Ingress 横須賀市」「イングレス」の4つになる。

PDFのURLを見るとDropboxではなく、はてなブログでの公開より後に設定したライブドアブログの方が反映されていた。
https://ruindig.blog.jp/Ingress-sightseeing_YukiUchida.pdf

ライブドアブログのトップページ<head>タグ内に設定したメタデータは以下の通り。PDFのURLについては、ライブドアブログのファイル管理機能でアップロードしたものを使用した。

<meta name="citation_title" content="<!--論文の題名-->"> /* 英訳せず日本語で入力 */
<meta name="citation_author" content="<!--論文の著者名-->"> /* 日本語で入力 */
<meta name="citation_publication_date" content="<!--論文の公開日付:YYYY/MM/DD-->">
<meta name="citation_abstract_html_url" content="<!--論文概要ページのURL(ライブドアブログの個別記事のURL)-->">
<meta name="citation_university_name" content="<!--大学名-->"> /* 日本語で入力 */
<meta name="citation_faculty_name" content="<!--学部学科名-->"> /* 日本語で入力 */
<meta name="citation_language" content="ja"> /* 言語:日本語の言語コードはja */
<meta name="citation_firstpage" content="<!--表紙と目次を含む上での最初のページ番号-->">
<meta name="citation_lastpage" content="<!--表紙と目次を含む上での最後のページ番号-->">
<meta name="citation_keywords" content="<!--複数のキーワードを;(セミコロン)区切りで入力:キーワードA; キーワードB;-->">
<meta name="citation_pdf_url" content="<!--ライブドアブログのファイル管理機能を使ってアップロードした、末尾が.pdfで終わるPDFのURL-->">

はてなブログに設定したメタデータではなく、ライブドアブログに設定したメタデータが反映されていた事から、以下のような結論となった。

【結論】
ブログのトップページのHTMLのhead要素に適切なメタデータを設定すれば、機関リポジトリにない卒業論文をGoogle Scholarの検索結果に表示させる事は可能だが、論文概要ページのURLのスキーム+ホスト名とPDFファイルのURLのスキーム+ホスト名を揃える必要がある。
論文概要ページ:https://ruindig.blog.jp/ingress/rd-yu-graduate-thesis.html
論文PDF:https://ruindig.blog.jp/Ingress-sightseeing_YukiUchida.pdf
一致するURLのスキーム+ホスト名の部分:https://ruindig.blog.jp

【今後の課題】

  1. 複数の論文を載せる場合、論文ごとにトップページのHTMLの<head>タグ内にメタデータを書かなければならないと思われる。そうした時に、<meta name="citation_title" content="{title}">で中括弧を使って要素を指定するように、個別のメタデータを入力する作業を省略できるようにしたい。
  2. 宮代さんと宮下さんの2017年の論文には、GoogleドライブとGoogleスプレッドシート、GitHub Pagesなどの複数のツールを組み合わせて使っている事が記されている。筆者は今のところ複数の論文を上げる予定はないが、複数のツールを跨いで使うよりも、ライブドアブログ内だけで完結させたい。

メタデータ設定の参考資料
宮代理弘,宮下芳明.オープンアクセスを見据えた研究室論文データベースの構築,研究報告ヒューマンコンピュータインタラクション(HCI),Vol.2017-HCI-174,Issue.12,pp.1-7,2017.
https://research.miyashita.com/papers/D186, 2020年3月23日参照。

Researchgate: Highwire Press tags embedded in HTML headers: Download Scientific Diagram, https://www.researchgate.net/figure/Highwire-Press-tags-embedded-in-HTML-headers_fig5_220364275, 2020年3月23日参照。

CyberLibrarian「ISO 639言語コード」https://www.asahi-net.or.jp/~ax2s-kmtn/ref/iso639.html, 2020年3月23日参照。

Google Scholar Help: Inclusion Guidelines for Webmasters; Indexing, https://scholar.google.com/intl/en/scholar/inclusion.html#indexing, 2020年3月23日参照。

Google Scholar Help: Inclusion Guidelines for Webmasters, https://scholar.google.com/intl/en/scholar/inclusion.html, 2020年3月23日参照。

ささくれ(2014年7月25日)『citation_pdf_urlでMendeleyにPDFをインポート』
https://cheb.hatenablog.com/entry/2014/07/25/002548, 2020年6月25日参照。

-end-

Discussion