🔭

1年分のAI実験ログから見えてきた「行政×生成AI」のこれから

2024/12/19に公開

はじめに

AI大好き、GovTech東京の橋本です。今年もアドベントカレンダーのシーズンがやってきました。生成AI分野はこの1年で目まぐるしい進化を遂げ、さまざまなツールや概念が登場しましたね。

本記事では、私が社内Teamsの「AIあれこれβ」チャンネルを通じて記録してきた1年間の試行錯誤を振り返りたいと思います。Azure OpenAIにはじまり、LangChain、DifyといったOSSツール、RAG関連やエージェント、MCPなどの技術、さらにはローカルLLM環境構築や自治体支援のPoC。とにかく幅広いトピックに飛びつき、定期的に「これ面白そう」「また詰まった」「こうすれば自治体でも使えそう?」と情報を社内にシェアしてきたかなーと思います。

GovTech東京に入ってちょうど1年ぐらい経った今、これまでの投稿をざっと振り返ってみると、意外なほど多様な技術に触れ、自治体での活用への展望も少しずつクリアになってきた気がします。このアドベントカレンダー記事では、その「1年分の学びと発見」を、AI好きなエンジニアや行政職員の方向けにまとめてみます!

自己紹介

私はGovTech東京のDX協働本部区市町村DXグループに所属してまして、今は都内の区市町村に対して生成AIの業務活用支援のプロジェクトをメインに担当しています(他にもウェブサイトの解析・改善のプロジェクトも)。全体的にめちゃくちゃやりがいがあります。

「AIあれこれβ」チャンネル発足の背景

なぜこのようなチャンネルを立ち上げたのか?その背景には、自治体や公共分野においても、最新テクノロジーも活用して職員の業務効率化・住民サービスの向上が求められている現状があります。生成AIが一気に注目され、メディアやSNSで「ChatGPT」などが話題になる中、「では実務でどう使う?」という問いが当然生まれます。

「AIあれこれβ」は、気になったサービスを試し、みんなと共有する「社内実験場」のような感じで機能していました。「失敗を恐れず、まずは試す」ことで、可能性も限界も肌で感じられるはずだ、という期待がありました。

このチャンネルの主な目的は以下の通りです。

  • 技術キャッチアップの場:毎日のように新サービスが登場するAI業界。何を使えば役に立つのか?試行するための迅速な情報ハブが必要でした
  • 組織文化の醸成:技術情報やノウハウ共有を通じてオープンで学習意欲の高い文化を育むこと
  • 自治体業務への応用模索:法制業務支援やRAG(Retrieval-Augmented Generation)の活用など、実務上の活用シナリオを発見・検証するきっかけづくり

こうして1年動かしてみた結果、驚くほど多様なテクノロジーが並ぶ壮大な「試行ログ」が出来上がりました。次から、この記録を定量・定性の両面から振り返り、得られた発見を共有したいと思います。

定量的な視点でみる1年間の投稿活動

  • 投稿頻度年間281件の投稿がありました。出来るだけ新鮮な情報を頻度高く投稿したい意識がありました

  • トピック別割合:概算ですが結構幅広な情報をピックアップしていますね

  • リアクション数:リアクションもらえるとシンプルに嬉しいです

目まぐるしく変化する技術トレンドを追いかける1年間の歩み

最初はAzure OpenAIをいじったり、もくもく会で内輪的な学習を促したりと比較的シンプルなところからスタートしました。しかし中盤からLangChainを使ったRAG(Retrieval-Augmented Generation)や、Difyでノーコードに近い形でLLMアプリ構築したり、Ollamaを介したローカルLLM運用など、次々と 「これも試したい!」 と飛び込んでいましたね。

  • 初期:Azure OpenAIを利用したもくもく会での勉強、基本的なプロンプトエンジニアリングに触れる
  • 中期:LangChainを使ったRAGに挑戦。Difyでノーコードアプリ構築。OllamaでローカルLLMを試して「Mac mini上でモデルが動く!?」と感動したり
  • 後期:GraphRAG、エージェント、MCPなど技術にも着手し、NotebookLMの進化や最新の大規模言語モデル、さらには国産LLM(PLaMo)にも興味を広げる

たかだか1年ですが、AI界隈は技術的「当たり前」が月単位で変わるようなスピード感だったので、投稿ログを読み直すだけでも相当な変化の激しさを実感します。いやぁ、動きが凄まじすぎる。

OSSツールやサービスが百花繚乱!

この1年で一番驚いたのは、「AI絡みのOSSや新しいツール、スゴイなー」ということです。

  • LangChain:RAGやエージェントの世界を広げる定番フレームワーク。プロンプトを部品化し、カスタムツールを組み合わせた高度なアプリ構築が容易になっていく流れを実感
  • Dify:ノーコードでLLMアプリを組み立て、RAGやワークフローを組める手軽さは、エンジニアでなくてもアイデアを形にできる可能性を示してくれました
  • Replit:環境構築の手間を省き、実験できる開発環境。AgentやAssistant機能まで積極的に導入していて、コーディングプロセス自体がAIドリブンになっていく雰囲気が漂います
  • ローカルLLM (Ollama):ベースモデルのダウンロードこそ大容量でしたが、Mac上でLlama3系モデルが動く喜びは大きい。「ローカルでもここまでできるの?」とワクワクしました

これらのツール群は、特別な大規模環境がなくてもPoCレベルなら十分可能なことを示してくれました。

自治体支援の中での実務PoC

自治体支援での実務検証が印象深かったです。法制業務へのロングコンテキスト適用を試したり、Azure VMで開発環境を立ててDifyを試験運用したり、試行錯誤も色々ありました。

ポイントだったのは「ただ生成AIに投げるだけではダメ」という当たり前だけど重要な事実。最初はRAGで法令データを参照させれば正確性が上がるかと思いきや、まだ期待ほどの精度はでなかったり、ロングコンテキストウインドウ使った方が上手く行ったり。自治体特有のセキュリティ要件があり簡単には折り合わなかったり。でも、諦めずにPoCを続けたことで、「法令業務ならこういうワークフローが必要」「社内文書をRAGで整理すれば、問い合わせ対応の手間軽減になるかも」といったアイデアが蓄積されてきたと思います。

これら実例は、まだフロントランナー的な試行段階ですが、来年以降、この蓄積は確実に生きてくるはずです。実務に直結するシナリオが整ってくれば、自治体業務が劇的に効率化できる可能性も十分見えてきました。

プロンプトエンジニアリングから「繋げる」時代へ

2023年は、プロンプトをいかに巧みに書くかが話題でしたが、今は「プロンプト+RAG+エージェント+ツール接続」の総合設計が求められています。

エージェントやMCP、いろいろなRAG手法(GraphRAGとか)といった概念は、モデル同士、モデルと外部データ、モデルとユーザーの知識をどう結合するかという「繋がりのデザイン」を可能にしました。単にLLMに話しかけるのではなく、LLMが裏で他のツールを呼び出し、外部データベースから知識を引っ張り出して回答する。しかも、その全プロセスを統合してノーコードに近い形で扱える方向へ進んでいます。

こうした統合が進むほど、自治体業務のような複雑なプロセスや大量の既存資料を扱うケースでも、AIが現実的な支援者として機能する可能性が高まります。

1年で得られたインスピレーションと来年への展望

この1年で分かったのは、「AIが一気に何かを置き換える」わけではないけれど、「地道なPoCや試行錯誤を通して、確実に使えるシナリオが増えつつある」ということです。

自治体向けであれば、RAGで既存ルールや条例を迅速に理解し、担当者が調べ物に費やす時間を減らす。OSSツールで小規模ながらもカスタムアプリを内製し、日々の問い合わせ対応やナレッジ共有をスムーズにする。そんな活用が現実的な姿として見え始めています。

来年、こういった活用はさらに加速するでしょう。GPTやGeminiやClaudeなどのモデルが賢くなり、国産LLMも成熟すれば、アプリ開発者はより豊富な選択肢と高品質なサービスを利用できる。行政と民間が連携し、オープンソースエコシステムで技術が磨かれることで、「トライしてみる価値」がどんどん増えていくはずです。

おわりに

この1年、毎週のように新しいモデルやツール、コンセプトを試し続け、正直なところ全部を使いこなしたとは言い難いです。でも、この試行錯誤こそが次の一歩を見つける鍵でした。プロンプトエンジニアリングから始まり、RAG、エージェント、マルチモーダル対応、ネイティブツール連携まで、発想を広げるきっかけが無数にあったと思います。

「行政×AI」に興味を持つ方へ、この1年の振り返りが少しでも刺激になれば幸いです。技術が高速に変化する今、行動あるのみですよね。次の1年は、実証実験から社会実装への加速の年にできればと思っています。

こんな募集も出しているのでお待ちしております!
https://herp.careers/v1/govtechtokyo/XBHehnChrd9K

GovTech東京

Discussion