ベクトル検索エンジンについてミリしらだったので、自分のお笑いの好みを題材にして実際に使ってみた
はじめに
上記の記事を拝見してベクトル検索という技術に興味を持ったのですが、ベクトル検索というものを1ミリも知らなかったので、自分自身の「お笑いの好み」を題材にして実際に使ってみた(実験してみた)記録を残します!
そもそもベクトル検索とは
(AI に書いてもらった)
ベクトル検索とは、テキストや画像、音声といった、従来のデータベースでは扱いにくかった「非構造化データ」を、「ベクトル」と呼ばれる数値の集まりに変換し、そのベクトル間の距離や角度を計算することで、データ同士の「意味的な近さ」や「類似性」を測る技術です。
例えば、文章の意味が似ている記事を探したり、画像の内容が似ているものを検索したりする際に強力な力を発揮します。
今回の実験では、お笑い芸人さんの youtube の動画の要約データをベクトル化し、それらを比較することで、内容の類似性や任意の芸人さんが自分の好みに合いそうか、といったことを分析するために利用しました。
今回の実験で使用したツール
今回の実験では、以下のツールを利用しました。
- Qdrant MCP サーバー: ベクトルデータベースとして、お笑い動画の要約データを保存・検索するために使用しました。
- Tavily MCP サーバー: Web 検索エンジンとして、追加の芸人情報を収集するために使用しました。
- Claude Desktop: 動画の要約データ処理や分析のプロンプト実行に使用しました。
- NotebookLM: 動画の文字起こしと初期要約の作成に使用しました。
実験プロセス
1. データ収集:好きなお笑い動画の選定と文字起こし
まず、分析の元データとなる、個人的に好きなお笑い芸人の公式 YouTube チャンネルから、気に入っている動画 or 好きな芸人さんの公式動画を15本程度ピックアップしました。
今回視聴した動画リスト
これらの動画の内容をテキストデータ化するため、NotebookLM を用いて文字起こしと簡単な要約を作成しました。
NotebookLM には以下のようなプロンプトを入力しました。
- この動画を文字起こしして、要約して
- 上記で上手く要約できない時は、以下のプロンプトを用いました。
- この動画の内容は日本のお笑い芸人の漫才(コント)となっています。その内容を要約してください
2. データ処理:要約データのベクトル化と保存
次に、NotebookLM で生成された要約データを、Claude Desktop を用いてさらに整形し、Qdrant に保存しました。この際、後で検索しやすいように、芸人名やコンテンツタイプなどのメタデータを付与しました。
添付したテキストをQdrantに日本語で保存してほしいです。これは日本のお笑い芸人のYouTubeの動画を文字起こししたものです。
Qdrantからデータを取得するときもあるので、適切なメタデータを考えてQdrantに保存してほしいです。メタデータの key を日本語にすることは禁止されています。
3. 分析フェーズ:Qdrant と Tavily を活用した嗜好分析
Qdrant に保存されたデータを用いて、まずは自分の好みの傾向を分析しました。具体的には、キーワード頻度、トピックモデリング、関連性スコアリングなどの観点から、保存された動画コンテンツの特徴を探りました。
私がピックアップした動画からは、「芸人同士の関係性」「シュールなユーモア」「社会風刺やパロディ」「学校・教育関連」といった傾向が見られるとのことでした。
また、令和ロマン、ジェラードン、ネコニスズといった比較的新しい世代の芸人に関する情報が多く、現代のお笑いシーンの一端を反映しているようでした。
詳細のやり取りは下記の通りです。
自分の好みを分析してもらうために入力したプロンプト
現在 Qdrant に保存されている情報は私が好きな日本のお笑い芸人の YouTube チャンネルについての情報です。
キーワードの出現頻度による重み付けや、トピックモデリング、関連性スコアリングを用いてどのような情報が保存されているのか最大限に思考を重ねて解析してください
結果
こんにちは!Qdrantに保存されているお笑い芸人のYouTubeチャンネルについての情報を分析してみましょう。まずは保存されている情報を取得してみます。
Qdrantに保存されている情報を分析した結果、これらは日本のお笑い芸人のYouTubeチャンネルに関連する情報で、主に以下のようなコンテンツタイプが含まれていることがわかりました:
## コンテンツの種類と特徴
1. **漫才・コント動画**
ネコニスズの「赤ちゃん」という漫才では、立野が41歳のロン毛でありながら「自分は赤ちゃんである」と主張し、山元がそれにツッコミを入れる展開になっています。 また、「ななまがり」による「あいのり」パロディの漫才では、恋愛バラエティ番組のフォーマットを利用し、個性的なキャラクター設定によるシュールな笑いが特徴となっています。
2. **トーク・対談動画**
ニューヨークのメンバーがバッテリーのジケという芸人について語る内容の切り抜き動画があります。ジケの強烈な個性と謎めいた魅力について、驚きや興味を語っています。 また、千鳥ノブと島田秀平による占いトークでは、ノブの生年月日から運命を占うやりとりが行われています。
3. **ドッキリ企画**
「高野さんを怒らせたい。【きしたかの】」という企画では、高野さんが一人でマリオパーティーをプレイしていると思わせて、実際には他のプレイヤーはCPUであるというドッキリが仕掛けられています。
4. **教育的内容**
令和ロマンが鬼越トマホークを慶應義塾大学生にするという企画では、慶應義塾大学の学部紹介や授業・サークル活動について詳しく説明されています。
## テーマと傾向分析
キーワードの出現頻度や関連性から、以下のような傾向が見られます:
1. **芸人同士の交流と関係性**
複数のエントリーで芸人同士の関係や評価が話題になっています。ニューヨークがバッテリーのジケについて語る動画では、強烈な個性を持つ他の芸人への興味や評価が中心テーマとなっており、NSCでの交流や相方との関係性などが語られています。
2. **シュールなユーモア**
ジェラードンのコント「3億当てて、会社辞めたら、見間違いで終わった」では、宝くじの高額当選を巡る騒動を中心に、日常と非日常が入り混じった、感情豊かな登場人物たちによるシュールな展開が特徴です。断片的な会話や脈絡の不明瞭さがジェラードンのシュールさを強調しています。
3. **パロディと社会風刺**
令和ロマンがM-1最終決戦で披露した「町工場」という漫才では、経営難に陥った下町のクッキー工場を舞台に、中小企業の苦境と大胆な発想、そして実現の難しさをコミカルに描いたパロディ漫才となっています。これは「下町ロケット」というドラマのパロディであることが最後に明かされます。
4. **学校・教育関連**
ジェラードンのコント「不登校の生徒を訪問する先生」では、中学校の担任の先生が2ヶ月ほど学校に来ていない不登校の生徒・竹森さんの自宅を訪問する場面が描かれています。先生は生徒の気持ちを尊重し、徐々に学校に戻れるようにサポートしたいという考えを示しています。 また、令和ロマンの慶應義塾大学に関する動画では、大学の学部や授業、サークル活動について詳しく紹介されています。特に小学部は「4年間心から楽しめる学部」として推奨され、サークル活動ではテニスサークルの「レギ」が楽しく女子も多いため推奨されています。
## メタデータ分析
メタデータからは以下のような情報が得られます:
1. **芸人・コンビ名**:
- 令和ロマン
- ジェラードン
- ニューヨーク
- バッテリー
- ネコニスズ
- 千鳥
- ななまがり
- ビスケットブラザーズ
2. **コンテンツタイプ**:
- transcript(文字起こし)が最も多い
- 漫才、コント、トーク番組が中心
3. **主要トピック**:
- お笑い
- 漫才
- M-1
- コント
- 大学お笑い
- ドッキリ企画
## 総合分析
これらの情報を総合すると、Qdrantには主に日本のお笑い芸人のYouTubeチャンネルから抽出されたコンテンツが保存されており、漫才やコント、トーク番組、ドッキリ企画などの多様なフォーマットが含まれています。内容的には、シュールなユーモア、日常的な出来事のコミカルな描写、芸人同士の関係性、教育や社会問題のパロディなど、多岐にわたるテーマが扱われています。特に、令和ロマン、ジェラードン、ネコニスズなど、比較的新しい世代の芸人に関する情報が多く含まれており、現代の日本のお笑いシーンを反映しているといえます。
さらに、この分析結果を踏まえ、今回ピックアップした動画に登場しない芸人さんが自分の好みに合うかどうかを予測する実験を行いました。
具体的には、以下の芸人さんについて Tavily MCP サーバーで情報を検索し、その情報と Qdrant の分析結果を照らし合わせて推論させました。
- マヂカルラブリー
- ウエストランド
- 永野
- からし蓮根
- 中川家
推論の結果、私の好み(シュール、独特な世界観、強烈な個性、社会風刺、若手・中堅)と照らし合わせると、永野さん、マヂカルラブリーさんは特に好みに合いそう、ウエストランドさん、からし蓮根さんも合う可能性があり、中川家さんはやや異なるかもしれない、という分析結果が得られました。
詳細なやり取りは下記の通りです。
自分の好みに合致するか推測してもらうために入力したプロンプト
ありがとうございます。
ではベクトル検索をさらに有効的に利用してみたいので、今から挙げる芸人が、私が好みの芸人かどうか Tavily を使って web 検索した後に、再度 Qdrant で取得した情報と合わせて推測をしてほしいです。
その芸人というのは以下の通りです。
* マヂカルラブリー
* ウエストランド
* 永野
* からし蓮根
* 中川家
結果
ご依頼いただいた芸人について、Tavilyを使ってWeb検索した後、Qdrantの情報と合わせて分析していきますね。まずは各芸人について調べていきましょう。
以上の情報をまとめた上で、ご挙げいただいた5組の芸人について、あなたの好みに合うかどうかを分析していきます。
## マヂカルラブリー
**Web検索結果から**:
マヂカルラブリーは吉本興業所属の2007年結成のコンビで、「マヂラブ」と略されます。2020年のM-1グランプリで優勝しました。野田クリスタルと村上で構成され、野田は中学生の頃から芸人を目指し、村上は法政大学のお笑いサークル出身です。その芸風については特異な特徴があり、「あれは漫才なのか」と議論を呼ぶほど独特のスタイルを持っています。野田クリスタルの全身を使った破天荒な振る舞いに、村上がツッコミを入れるスタイルです。
**Qdrantの情報との一致点**:
Qdrantの保存情報にはマヂカルラブリーについての直接的な記述はありませんが、あなたの好みと思われる特徴として「シュールで独特な世界観」「強烈な個性」「パロディ要素」などがあり、これらはマヂカルラブリーの特徴と重なります。特に野田クリスタルの予測不能な動きや独特の世界観は、ジェラードンのシュールなコントや、強烈な個性に惹かれるという傾向と合致します。
**推測**:
マヂカルラブリーは**あなたの好みに合う可能性が高い**と考えられます。特に「あれは漫才なのか」と議論を呼ぶほどの独自の芸風は、従来の枠に収まらないオリジナリティを重視するあなたの好みに一致するでしょう。野田クリスタルの異質な動きを含む破天荒なパフォーマンスは、シュールなコメディを好むあなたにとって魅力的に映る可能性が高いです。
## ウエストランド
**Web検索結果から**:
ウエストランドは、「毒舌漫才」が特徴のコンビです。2022年のM-1グランプリで優勝しました。河本が話題やお題を振り、井口が猛烈な勢いで不平不満をまくしたてるように超高速ロングツッコミを入れるスタイルが定番です。近年はコンプライアンスが重視される中、「ぐうの音も出ないほどの悪口漫才」で窮屈な時代に逆行するような芸風が特徴です。
**Qdrantの情報との一致点**:
Qdrantの情報から、あなたは「社会風刺やパロディ要素のある作品」「独特の世界観を持った作品」に惹かれる傾向があります。ウエストランドの「毒舌漫才」や「時代に逆行する」という姿勢は、現代社会への風刺や批評といった側面を持ち、これはあなたの好みと一致する可能性があります。
**推測**:
ウエストランドは**あなたの好みに合う可能性がある**と考えられます。特に、彼らの「毒舌」「悪口漫才」といった要素は、既存の枠に収まらない独自性や社会批評的な側面があり、これはあなたが好む知的なユーモアや風刺の要素と一致します。ただし、あなたがシュールさや独特の世界観をより好む場合、ウエストランドの直接的で辛辣なスタイルは、あなたが最も好むタイプの笑いとは若干異なる可能性もあります。
## 永野
**Web検索結果から**:
永野は「孤高のカルト芸人」と称されるピン芸人で、シュールで独特なコントを得意としています。2015年頃に「ゴッホより普通にラッセンが好き」と歌って踊るネタでブレイクしました。彼の存在は異端的で、キモいと評されながらも多くの芸能人が彼のファンを公言しています。お笑いライブ界ではずっと前から一目置かれる存在でした。
**Qdrantの情報との一致点**:
Qdrantの情報から、あなたは「シュールで独特な世界観のコント・漫才」「強烈な個性を持つ芸人」に惹かれる傾向があります。永野の「カルト芸人」としての立ち位置や、シュールな芸風は、あなたの好みとかなり一致しています。
**推測**:
永野は**あなたの好みに非常に合う可能性が高い**と考えられます。「孤高のカルト芸人」という異端的な立ち位置と、シュールで独特な芸風は、あなたが好む「シュールさ」「強烈な個性」に完全に一致します。また、主流から少し外れた位置にいながらも認められる存在であるという点も、あなたが好むタイプの芸人像に合致すると思われます。
## からし蓮根
**Web検索結果から**:
からし蓮根は、ボケの伊織とツッコミの杉本青空による漫才コンビです。熊本弁を交えた独特の漫才が特徴で、伊織の繰り出す淡々としていて奇想天外なボケと、杉本の熊本訛りの鋭いツッコミが持ち味です。コンビ名は熊本の郷土料理「辛子蓮根」から取られています。
**Qdrantの情報との一致点**:
Qdrantの情報から、あなたは「少し捻りのある知的なユーモア」「独特の世界観を持った作品」に惹かれる傾向があります。からし蓮根の「奇想天外なボケ」や「熊本弁を交えた独特の漫才」は、あなたの好みと一致する可能性があります。
**推測**:
からし蓮根は**あなたの好みに合う可能性がある**と考えられます。特に、伊織の「奇想天外なボケ」や地方の方言を活かした独特の世界観は、あなたが好む「捻りのあるユーモア」や「独特の世界観」に合致します。ただし、Qdrantの情報からは、あなたがより強烈なシュールさや個性の強さを好む傾向も見られるため、からし蓮根の芸風がどの程度あなたの好みに合うかは、彼らのボケやツッコミの奇想天外さの程度によるかもしれません。
## 中川家
**Web検索結果から**:
中川家は兄の剛と弟の礼二による兄弟漫才コンビで、2001年のM-1グランプリ初代王者です。兄弟ならではの息の合った掛け合いと日常生活をテーマにしたユーモアが特徴で、特に礼二のモノマネは有名です。剛がちょっかいを出して礼二がツッコみつつも次々話を進めるコント漫才が特徴的です。
**Qdrantの情報との一致点**:
Qdrantの情報から、あなたは「ストーリーテリングへの関心」「社会風刺やパロディ要素のある作品」に惹かれる傾向があります。中川家の「日常生活をテーマにしたユーモア」や「コント漫才」は、ある程度のストーリー性を持っており、これはあなたの好みと一部一致する可能性があります。
**推測**:
中川家は**あなたの好みとやや異なる可能性がある**と考えられます。彼らの芸風は高い技術と共感性のある内容が特徴ですが、Qdrantの情報から推測されるあなたの好みである「シュール」「知的なユーモア」「強烈な個性」などの要素は、中川家の芸風には比較的少ないかもしれません。中川家は日常的で共感性の高いお笑いを得意としており、これはあなたが好むやや異質でシュールな笑いとは少し異なる可能性があります。
## 総合評価
以上の分析から、5組の芸人の中であなたの好みに合う可能性が高いのは:
1. **永野** - シュールで独特な世界観と強烈な個性が、あなたの好みに非常に合致
2. **マヂカルラブリー** - 独自の芸風と破天荒なパフォーマンスが、あなたのシュールなコメディへの好みに合致
3. **ウエストランド** - 毒舌漫才という独自性と社会批評的な側面が、ある程度あなたの好みと一致
4. **からし蓮根** - 奇想天外なボケや地方の方言を活かした独特の世界観が、部分的にあなたの好みと一致
5. **中川家** - 技術の高さはあるが、あなたが好むシュールさや知的なユーモアとは若干異なる芸風
なお、これらの推測はQdrantのデータと検索結果からの分析に基づいており、個人の好みは多面的で複雑なため、実際の好みとは異なる可能性もあります。
実験結果と考察
一連の分析の結果、ベクトル検索によって導き出された私の好みは、自己認識と非常に高い一致を見せました。
特に、Qdrant のデータから推測された私の好きな笑いの傾向(シュール、独特な世界観、強烈な個性など)や、Tavily の情報と組み合わせて予測された芸人さんとの相性ランキングは、普段感じている自身の嗜好とほぼ合致していました。
例えば、永野さんやマヂカルラブリーさんが上位に来たのは「確かにそうだろうな」と感じる結果でしたし、一方で中川家さんが少し離れた位置づけになったのも納得感がありました。
(中川家さんももちろん好きです、念のため)
この実験を通して、ベクトル検索が単なる類似文書検索だけでなく、個人の嗜好性のような抽象的な概念の分析にも利用できることを実感しました。
面白い!
まとめ
今回は、Qdrant や Tavily といった MCP サーバーを利用して自分のお笑いの好みをデータに基づいて分析する実験を行いました。
改めて自分の好みを言語化できた気がしますし、なんらかの形でベクトル検索を仕事でも使えたら面白そうだなと感じました!
(参考として、 vibe coding に利用している公式ブログ)
Discussion