🍣

【AI検索エンジン】Perplexityで学ぶ次世代での情報収集術

2024/12/13に公開

https://qiita.com/advent-calendar/2024/miraito-inc

12日目はucanの「Laravel から一歩先へ。クリーンアーキテクチャによる柔軟な設計術」の記事でした。の記事でした。

はじめに

皆さんは一日に何回検索をしていますか?
仕事や生活によって異なりますが、おそらく数十回は検索しているのではないでしょうか。

これまで私たちは、Googleなどの検索エンジンを使って情報を収集し、それを整理して知識として蓄積してきました。しかし、膨大な情報の中から本当に必要な情報を見つけ出すことは常に課題でした

単純なキーワード検索では、関連性の低い情報や表面的な情報に埋もれてしまい、本質的な理解に至るのに時間がかかっていたのです。

生成AIの登場により、この課題を根本的に解決するAI検索エンジンが誕生しました。今回は、その代表的な存在であるPerplexityを例に、新しい情報収集の方法を探っていきます。

本稿を通じて、AI検索がどのように私たちの情報収集に役立つのか、そのイメージが伝われば幸いです。

現状の課題 検索エンジンの限界

インターネット上には膨大な情報が存在します。時にはその中から自分が知りたい情報にたどり着くまでに苦労したことはないでしょうか?

検索エンジンには、次のような課題があります。

例えば、「人工知能の歴史」について調べたい場合、従来の検索エンジンは単純に「人工知能」「歴史」というキーワードに合致するページを列挙するだけでした。しかし、ユーザーが本当に知りたいのは、AI発展の背景や、どのような技術的ブレイクスルー(飛躍的進化)があったのかといった事でした。
そのキーワードから文脈を推測しないといけないですがそれは簡単な事ではありません。

これらの情報を得るためには、ユーザー自身が複数のページを渡り歩き、情報を自力で組み立てる必要がありました。検索結果は表面的で、本質的な理解には程遠いものだったのです。

そんな課題を解決してくれるのがAI検索エンジンという訳なんですね。

AI検索エンジンが提供してくれる価値

検索エンジンが抱えていた課題を解決し、AI検索エンジンは次のような価値を提供してくれます

1. 文脈の理解

検索クエリ(問い)に自然言語を使用できるようになったため、質問の背景や意図を伝えられるようになりました。

例えば「人工知能の歴史」という単純な検索から、「AI発展の背景を詳しく知りたいから人工知能の歴史について調べて」といったように、質問の意図を明確に伝えることで、より深い文脈を理解した回答が得られるようになりました。

2. 関連情報を収集し比較してくれる

複数の情報源から関連性の高い情報を瞬時に収集し、整理してくれることで、ユーザーの情報収集の手間を大幅に削減してくれます。

特筆すべきは比較機能です。比較をしたい場合、AIが自動的に適切な比較軸を分析・設定し、表形式で分かりやすくアウトプットしてくれます。この機能により、情報の整理と理解が格段に効率化されました。

余談ですが色々なサイトから情報を集めようとするとサイト内にある広告を閲覧しなくて済むのが快適です。

そう考えると今まで記事の広告収入を得ていた人たちは今後苦しくなりそうですね。

AI検索エンジンの種類

以下は、主要なAI検索エンジンを知名度の高い順に表形式でまとめたものです。

※Felo AIがまとめた内容です。

サービス名 特徴
Perplexity AI リアルタイムで情報を収集し、出典付きの回答を生成。複雑な質問にも対応し、専門的な洞察を提供。
Google (Gemini) 世界最大の検索エンジン。AIモデル「Gemini」を活用し、検索結果の要約や旅行プラン作成が可能。
ChatGPT Search 2024年11月にリリース。OpenAIのChatGPTをベースにした検索機能。会話形式での質問に答え、リアルタイムでインターネットから情報を取得して回答を生成します。
Felo AI 日本発のAI検索エンジン。多言語対応や深堀り検索が可能で、スライドやマインドマップ生成機能も搭載。
Genspark ユーザーのクエリに基づいてカスタム生成された「Sparkpages」と呼ばれるページを提供する点が特徴です。このページは、複数の信頼できる情報源からデータを統合し、簡潔かつ正確な情報を提示します。情報の真偽を検証したい場合に使えるファクトチェックという機能があります。

本当はまだまだありますが、皆さんが触る可能性があるものに絞りました。

気になる方は調べて見てください。

Perplexityって何

Perplexity(パープレキシティ)って呼びます。はい。めちゃくちゃ呼びにくいです。
略称でパープレと呼ぶみたいです。

発表時期は2022年の12月に発表されたサービスです。

ユーザが検索エンジンを使って情報を収集して整理している作業を効率化して、最小限の労力で必要な情報を得ることを出来るようにしたサービスです。

Tips

2024年6月からSoftBankと提携を開始してから国内での利用・認知度を伸ばしています。

嬉しいことにSoftBankユーザであれば2025年6月18日まで無料で使えるため、ぜひこの機会を利用してAI検索エンジンをフル活用してみてください。

https://www.softbank.jp/corp/news/press/sbkk/2024/20240617_01/

基本機能

検索内容のまとめ

質問を入力することで文脈を理解してユーザが求めている情報を整理して回答してくれます。
とはいえ質問をする時に言葉が足りていないと欲しい情報を得られないかもしれないので使う人はしっかり文章構造を意識して入力してあげるように気をつけましょう。

また他のAI検索エンジンは言語モデルは決まっていて切り替えることが出来ないのですが、Perplexityは切り替えることができます。言語モデルにも得意・不得意があるので用途別に切り替える事ができるのはかなり有用です。

とはいえ自分は9割方はClaude 3.5 sonnetです。やはり日本語の文脈理解度と回答精度がダントツなんですよね。

検索範囲の絞り込み

検索時にモードを指定することで検索範囲を指定することが出来ます。

基本的にはウェブですが、学術というモードがあるのですが論文をソースに調べてくれます。「タンパク質がなぜ筋肥大に関係するのか」みたいに科学的根拠があるかを調べたい時は学術を使う事があります。

ソースの確認

生成した情報が何を根拠に回答しているかは常に気になりますよね。Perplexityの全ての回答にはソースが明確に記されています。ユーザの方で提示された情報を確認できるようになっています。

実際に回答結果を見てもらう方が早いので共有します。

https://www.perplexity.ai/search/aijian-suo-ensintojian-suo-ens-6f_2flAZQp2C3wYn6KqYtw#0

そしてこんな感じで回答結果を簡単に共有できるのが何気に便利です。

関連情報の深堀り

回答結果のページの一番下の方を見てもらうと関連という項目があります。

そこに質問に対する回答結果からPerplexityが関連情報を列挙してくれます。
この機能のおかげで更に関連する情報にたどり着くことで理解がより深まるといった事があります。

Pro Search機能(有料)

Perplexityには「Quick search」と「Pro search」という2種類の検索方法があります。

特徴 Quick Search Pro Search
回答のスピード 早い やや時間がかかる
回答の深さ 簡潔 詳細で網羅的
利用可能な回数 無制限 無料版では4時間に5回、有料版では1日600回
主な用途 日常的な質問や基本的な情報収集 ビジネスや学術研究、複雑な分析
料金 無料 月額20ドル(無料版もあり)

Quick Searchを単一の事実確認や即答できる内容の質問をするのに向いてます。

対してPro Searchは複雑な質問に対して段階的に解決していきます。人間の思考プロセスに近い形で問題に取り組むため、より詳細で実用的な回答をしてくれます。

具体的な質問例

シンプルな質問(Quick Search向き)

  • 東京タワーの高さは?
  • 新紙幣のデザインはいつ変わった?

複雑な質問(Pro Search向き)

Quick SearchとPro Searchの結果を見比べてもらうと一番最初にこんな感じの思考プロセスが出てきます。

「なぜ日本は円安になったのか」という質問に回答するために、円安の原因がなんだったのか、原因を探るために直近の円安に関するニュースを調べるといった事を自分で推論してくれるのです。

このPro Searchがかなり便利なのでぜひ試してみてください。

高度な機能

スペース

Perplexityのスペースは、特定のテーマに関連する検索や会話をまとめて管理できる機能です。ChatGPTのGPTsと同様に、目的に特化した検索環境を作成できますが、より柔軟なファイル管理と共同作業機能を備えています。

主な特徴

カスタマイズ可能なプロンプト設定
スペースごとに独自のプロンプトを設定できます。例えば、自分はAWS認定試験勉強をしているので試験用の学習スペースを作っています。プロンプトはこんな感じのことを書いてます。

こんなプロンプト考えるの面倒だよと思ったあなたにおすすめなのがプロンプトジェネレータです。
詳細は割愛しますが、OpenAIやAnthropicが提供してくれてるので気になる方は調べてみてください。

ファイル管理システム
PDFや文書ファイルをスペースにアップロードすると、検索時の参照資料として活用できます。これはRAG(Retrieval-Augmented Generation:検索拡張生成)の仕組みを採用しており、アップロードした資料の内容を考慮した、より正確な回答が得られます。
イメージとしてはNoteBookLMの要素が加わった感じです。

アップロードされたファイルは質問への回答生成にのみ使用され、他の目的での利用や共有は行われないとの事ですが機密情報を取り扱う場合は事前に確認してから使いましょう。[1]

共同作業機能
スペースは他のユーザー(ログイン必須)と共有可能です。複数人で情報収集や学習に使うことも出来ます。

ページ(有料)

詳細な情報をまとめた1つのWebページを簡単に作成できる機能です。

スペースは情報収集だけでしたがページは情報を整理してレポートとして提出する場合に使います。

調べたい内容を記事タイトルにいれると全体の骨子を生成してくれるため、細かい調整をそこからしていく感じになります。

こんな感じで関連するセクションの生成も提案してくれます。優秀。

またオーディエンスという設定があるのですが、ページを閲覧する人に合わせた内容を生成してくれるようになります。

php8.4について生成されたページを共有しますのでどんなもんのかと気になる方はこちらかどうぞ。

拡張機能

ちなみにchrome拡張もあります。
https://chromewebstore.google.com/detail/perplexity-ai-companion/hlgbcneanomplepojfcnclggenpcoldo?hl=JA

インストールすると右上にアイコンが出ます。直接Perplexityを使えるようになります。

クリックするとこのようなメニューが出るのですが、これは検索範囲をドメインに絞るか、現在開いているページを範囲にするのかといったような事ができるようになります。
検索範囲が決まっている場合に便利です。

拡張機能を使わなくてもプロンプトにURLを貼り付けることで同様のことはできます。

まとめ

AI検索エンジンが検索エンジンのどういった課題を解決してくれるかとその課題を解決してくれることでどれほど情報収集が効率化されるか伝わりましたでしょうか。

自分はAIによる情報収集がどんなものかを実験する感じで意識的にGoogle検索をしないようにしてます。とはいえ辞書的な使い方をしたい場合はまだ使ってはいますが。

SEOの常識も1,2年で変わるかもしれないですね。

検索といえばexaWebsetsというサービスが先日発表されました。

大規模言語モデル(LLM)の埋め込み技術を活用して約10億ページのウェブコンテンツをベクトル化(日本語や英語などの自然言語の単語や文を数値化)することで、文脈や意味を理解した検索を実現できるようにしたサービスです。

ウェブコンテンツをDBみたいにしてそこに対して検索をかけるようなイメージになってるそうです

流行るかはどうかは置いといて、楽しみですね。

概要を知りたい方はこちらの記事を読んでみてください。それかPerplexityを使ってみましょう。
https://www.technologyreview.jp/s/351005/the-startup-trying-to-turn-the-web-into-a-database/

長くなりましたが今回は以上となります!

終わりに

14日目はucanの「プログラミング言語のバージョン管理ツールの導入」の記事です。
お楽しみに!

脚注
  1. ファイルアップロードはどのように機能しますか? ↩︎

Discussion