📝

RSSリーダーを利用したエンジニア/研究者の情報収集パイプライン

2023/12/16に公開

TL;DR

この記事の提案パイプラインをChatGPTにフローチャートで書かせて、少し手で弄りました

やりたいこと

エンジニア/研究者として、日々アップデートされ続けていく技術にキャッチアップする必要がある中、以下のような悩みを抱えていました。

  • Twitterで情報収集をした気分になっているものの、
    • 玉石混交であり、自分の集めている情報の網羅性・品質に自信がない。
    • 中でも目に止まったTweetに「いいね」をつけてはいるものの、適切なカテゴライズがされておらず、後から探すのが面倒。
    • Twitterの、張り付いていないとフロー情報が流れてしまう感じが苦手(例えば1, 2週間Twitterを開かなかったときに、その間バズった情報を追いかけるのが大変)
  • Tech blog等のニュースレターを購読したが、いつの間にかメールボックスに埋もれている。
  • 上記の問題を解決するためにRSSリーダーを導入してみたが、
    • そもそもRSS対応していないサイトが多い。
    • 適当にRSSリーダーに追加しまくった結果、未読が溜まり、RSSリーダーを開くのが億劫になる。

これはマズイと思い、私の求めている理想状態を以下のように整理しました。

  1. 「後で読む」情報が、自動かつカテゴライズされた状態でストックされている
    • 例えば好きなテックブログブログの更新分、信頼しているフォロワーのツイート、信頼している著者の新作論文など。
  2. 上記の情報に目を通し、重要だと思ったものをさらに「お気に入り」としてストックできる。またその際、適切なカテゴライズがされている。

このようにすると、収集される情報が適切にカテゴライズ・構造化されているため、後から探すのが容易になります。また1の「自動収集」ステップと2の「お気に入り」ステップを明示的に切り分けることで、情報の質の担保ができるようになります。

上記の理想状態を達成するために、大きく分けて4つの仕組み構築する必要がありました。

  • ① Web上で更新のあった情報(ブログ、tweetなど)をRSSリーダーを活用して自動で「後で読む」化する仕組み
  • ② RSS対応していない情報源の更新を自動でトラッキングする仕組み
  • ③ ネットサーフィン中に気になった情報(ブログなど)を「後で読む」カテゴリとして①と統合する仕組み
  • ④ 自分が目を通した情報を構造化し、「お気に入り」としてストックする仕組み

以下で、①〜④の実現方法について説明していきます。

① RSSリーダーを「後で読む」プールとして活用する

RSSリーダーとして、自分はInoreaderを使っています。基本的にはInoreaderのフォルダ機能を使って、ブログ等の情報源を適切にカテゴライズするだけです。

② RSS対応していない情報源のトラッキング

私の場合、以下それぞれの情報源が問題となりました。

  • 論文: 例えば「特定の著者の新作論文」や「特定の論文を引用した論文」についてトラッキングしたい。これはGoogleScholarのアラート機能 + Gmailの転送機能で実現できます(ただし、InoreaderのProプラン、つまり課金が必要)。
  • Twitterの特定の人物の投稿一覧: タイムライン形式でtweetを確認するのではなく、人ごと/リストごとに確認する方が好きです。Twitterの情報をRSSフィードとして取得することは、Inoreaderでは直接サポートされていませんが、RSSHubを使うことで実現できます
  • RSSに対応していないwebサイト(ブログ等): 以下三つの方法があります。
    1. Inoreaderに課金し、フィードの自動生成機能を使う(現在はこちらを採用)
    2. 3rd-party製のRSS-feed-generatorを使う(FetchRSSなど)
    3. (news letterを配信している場合) Inoreaderに課金し、News Letter機能を使う

③ ネットサーフィン中に「後で読む」化したい情報をRSSリーダーに流す

InoreaderのChrome拡張を使えば、簡単にInoreader中にストックしておくことができます。

④ 「お気に入り」情報を構造化してストックする

自分の場合はPocketのChrom拡張を使い、タグをつけることでカテゴライズしています。

ここについてはもっと良いやり方があるかもしれません。例えば単に記事を保存するだけでなく、自分なりのコメントを加えたり、他の情報源との関係性を記述したい場合は、ScrapboxNotionといったツールの方が優れています。

おわりに

今の所個人的には満足していますが、Twitter含めてRSSに対応していないサイトが多く、ちょっと脆弱かもしれません。またInoraderへの課金を前提としています。無料でできる方法があったらぜひ共有していただけると嬉しいです。またいつか別記事で、自分がこの情報収集パイプラインに組み込んでいる情報源を公開するかもしれません(AI系です)。

参考にさせていただいた記事

Discussion