杏の【ぐーたらでも分かる】生成AIの基礎の基礎~印税生活への道はまだ遠い~
杏ちゃん、「Vocabulary」「Context file」「Schema」について教えて
ふぁ~あ…プロデューサーがさ、なんか新しいお仕事持ってきたんだよね…。
「杏ちゃん、最近流行りの生成AIについて、みんなに分かりやすく教えてあげてほしいな!」だって。
え~、めんどくさいじゃん…。でも、これで杏の人気が出て、印税生活が送れるなら…ちょーっとだけ頑張るかぁ…。
というわけで、今日はみんなが「???」ってなってる生成AIの、特に大事な3つの言葉について、この杏が特別に教えてあげる。
寝てても分かるように説明するから、ありがたく聞くように!
1. まずは基本のキ!「Vocabulary (専門用語)」
これね、簡単に言うと「AIにも分かる言葉で話しかけようね」ってこと。
人間だってさ、「アレ取って」じゃ分かんない時あるでしょ? AIはもっと正直だから、「もっと具体的に言ってよ~」ってなるわけ。
-
Vocabulary (ボキャブラリー / 専門用語)
- 杏的解説: AIと会話するための「共通言語」みたいなもん。
-
例:
- 「プロンプト (Prompt)」:AIへの「お願い」とか「命令文」のこと。「今日の晩御飯、何がいいと思う?」って聞くアレね。
- 「LLM (大規模言語モデル)」:めっちゃ賢いAIのこと。杏よりは賢い…かも。
- 「トークン (Token)」:AIが言葉を理解するときの最小単位。文章をバラバラにしたパーツみたいなイメージ。杏の好きな飴ちゃんを1個、2個って数えるのに似てる…かな?
こういう言葉を知ってると、AIに的確なお願いができるようになるんだって。
まぁ、杏は「飴ちゃん持ってきて」で通じるAIが欲しいけどね。
2. AIにも個性が必要?「Context file (文脈ファイル)」
次に「コンテキストファイル」。これ、カンニングペーパーみたいなもん。
AIに「こういう感じでお願いね」って、事前に詳しい情報を教えてあげるファイルのこと。
-
Context file (コンテキストファイル / 文脈ファイル)
- 杏的解説: AIに「お手本」とか「設定資料」を渡して、賢く、そして「それっぽく」振る舞ってもらうための秘密兵器。
-
例:
- 杏のキャラでAIに喋らせたい時:「双葉杏は17歳、働きたくないアイドル。口癖は『働きたくない』『印税生活したい』。好きなものは飴と寝ること」みたいな情報をまとめたファイルをAIに読ませる。
- そうすると、AIが「杏ちゃんっぽく」答えてくれる確率が上がるわけ。便利でしょ? これがあれば、杏が寝てても杏が仕事してることになる…かも!
つまり、AIに特定の役割を演じさせたり、特定の知識に基づいて答えてほしいときに、この「コンテキストファイル」を使うと、AIの精度がぐーんと上がるんだ。
これで杏の代わりにプロデューサーと会話してくれるAIとか作れないかなぁ…。
3. 情報を整理整頓!「Schema (スキーマ)」
最後は「スキーマ」。これね、情報の「整理棚」とか「設計図」みたいなもの。
AIにただ情報をドーン!って渡しても、何が何だか分かんなくなっちゃうでしょ?
-
Schema (スキーマ)
- 杏的解説: AIが情報を理解しやすいように、データの「形」や「ルール」を決めてあげること。
-
例:
- アイドルの名簿を作りたい時:
- 「名前:(文字列)」
- 「年齢:(数字)」
- 「好きなもの:(文字列のリスト)」
みたいな感じで、各項目にどんな種類のデータが入るか(文字なのか、数字なのか、リストなのか)を事前に決めておく。
- これをちゃんと設定しておくと、AIが「これは名前だな」「これは年齢だな」って正しく理解して、情報をうまく扱えるようになるの。
- アイドルの名簿を作りたい時:
杏の部屋のお菓子だって、グミはこっちの箱、チョコはあっちの引き出しって、一応(?)分けてるじゃん? それと一緒。…たぶん。
データが整理されてないと、AIも「どこに何があるのー!?」ってパニックになっちゃうからね。
ふぅ…大体こんなもん?
「Vocabulary」「Context file」「Schema」。
この3つを何となく分かっておけば、プロデューサーがAIの話をしてても、「あー、アレのことね、はいはい(分かったフリ)」くらいはできるようになる…はず。
これで杏もAIマスター?…なわけないか。でも、これくらい知ってれば、みんなもAIともうちょっと仲良くなれる…かもね。
じゃ、杏は頑張ったからもう寝る。印税生活は…まだかなぁ。おやすみー(すやぁ)
感想戦
いかがでしたか?
プロデューサーの黒ヰ樹(くろいいつき)です。
様々な生成AIに関する記事を読んできた私は、もっとシンプルに表現できないかずっと考えていました。
いわゆる江戸時代から続く基礎教養「読み」「書き」「そろばん(計算)」、コンピュータ利用における基礎教養「ITリテラシー」「メディアリテラシー」「セキュリティ意識」みたいな三種の神器が必要だと感じました。
最近の技術記事ではやれRAGだのMCPだのバズワードばかりが独り歩きしていて、さらに生成AIで生成された記事も多いものですから、バズワードを使用していない普通に人間が書いただけの記事は読まれなくなりつつあります。
ではいっそのこと100%生成AIだと分かるような記事でシンプルな表現を紹介してみたらどうなるんだろうと思い、今回100%生成AIで生成した記事を公開した次第です。
めっちゃメディアミックスされているとあるアイドルを育成するシミュレーションゲームのキャラクターみたいな感じですが、本家とはあまり関係がないと思います。多分。これって二次創作?
もともとプロンプトエンジニアリングのroadmap.shを読んでおり、Vocabularyが最も重要だということは把握していて、IPA試験を受けまくったりしていたのですが、たまたまVerifiable Credentials 2.0関連W3C Recommendationを確認していく中でVocabulary, Context file, Schemaを紹介しているページを発見したのが、生成AI活用における基礎教養「Vocabulary」「Context file」「Schema」を紹介したきっかけです。
Discussion