2025年5月22日、私が生成AIとともに生き残るために考えていること(2025年6月30日更新)
はじめに
長いことAIや生成AIについてパラパラパラーっと書いてきましたが、とにかくAIや生成AIは主語が大きすぎるので1つのテーマで1つの記事を書いていくだけでは時間がいくらあっても足りなくなってきましたし、MicrosoftやGoogleをはじめとした企業がどんどん新しい概念を作っていくので、いよいよついていくのがしんどくなってきました。
普段生成AIを活用する分には今のところ困っていないですし、普通の人は仕事で使わないこともあり、AIと会話したり給与支払明細書や源泉徴収票に何が書いてあるかぐらいでしか役に立たないこともあると思うので、別にこんなことを考えなくてもいいのですが、早めに考えておけば働かなくて済むことが増えるので考えるようにしています。
なので特にソースや根拠を示さずに詳しい解説もなく、私が生成AIとともに生き残るために考えていることだけをまとめて記事にしたいと思います。
ワードサラダのような記事になってしまいますが、いくつかの内容は過去記事に書いてあるのでそちらを読んでください。
AIは仕事を減らすためにあってほしいので、AIを使うために仕事が増えるのは避けたいというのがモチベーションとしてあります。
おことわり
本当にSNSやスクラップあたりに書いたほうがいい内容を記事にしているだけなので非常に読みづらいと思います。
特に見出しは何も考えずにつけているので本文とあまり関係性がなかったりするかもしれません。
考えている最中なのでリストの内容は増えたり減ったりするかもしれません。
ただ現時点ではかなりいい感じだと思っています。
基礎教養
まず、江戸時代から続く基礎教養「読み」「書き」「そろばん(計算)」、コンピュータ利用における基礎教養「ITリテラシー」「メディアリテラシー」「セキュリティ意識」みたいないわゆる三種の神器を生成AIの活用において定義したいと思います。
- Vocabulary (ボキャブラリー / 専門用語)
 - Context file (コンテキストファイル / 文脈ファイル)
 - Schema (JSON Schema / スキーマ)
 
そもそも生成AIはAIや検索とどう違うのかも定義したいと思います。
- TDM (テキストデータマイニング。情報抽出の自動化プロセス全般)
 - AI (AIはテキストデータマイニングの一種。機械学習システムの訓練・利用)
 - GAI / GenAI (生成AIはAIの一種。コンテンツ生成可能な機械学習の訓練・利用)
 - Search (検索はテキストデータマイニングの一種。検索インデックス生成・検索アプリケーション利用)
 
2025年5月22日現在、最も使われているLLMは以下の三種です。
- ChatGPT (OpenAI)
 - Gemini (Google)
 - Claude (Anthropic)
 
これらのLLMと開発企業は以下クラウドサービスと密接な関係性があります。
- Azure / Microsoft Azure (OpenAIのGPT)
 - GCP (GoogleのGemini)
 - AWS (AnthropicのClaude)
 
したがって、今からLLMを作るのはオススメしません。
もし作るのであればQwen(クラウドサービスはAlibaba Cloud)やDeepSeekのような蒸留、量子化、プルーニング(枝刈り)を行って低コストにしたオープンソースAIにするといいでしょう。
なお、LlamaはMetaが勝手にオープンソースAIと言っているだけなので、オープンソースAIの定義には注意しましょう。
オープンソースAIの定義は以下のとおりです。
日本語訳は以下のとおりです。
生成AI
生成AIの生成において最も使われるフォーマットは以下のとおりです。
- JSON
 - Markdown
 - Git
 
JSONだけでは表現できないケースもあるので、以下フォーマットを使います。
- YAML
 - TOML
 
Markdownだけでは表現できないケースもあるので、以下フォーマットも使います。
- Frontmatter
 - Mermaid
 
生成AIにおいて以下の要素はとても重要です。
- Heading (見出し)
 - Seriation (系列化 / 分類)
 
例えば見出しであればMarkdownで以下の三段階に分けることができます。
# 大見出し
## 中見出し
### 小見出し
他にも分類であればMarkdownで以下の三段階に分けることができます。
*   大分類
    *   中分類
        *   小分類
また、以下内容を理解しておくと管理が楽になります。
- Base64
 
Gitは使いづらいので、以下VCSも視野に入れておきます。
- Mercurial
 - Pijul
 - Jujutsu
 
AIコーディングエージェント
エージェントとは何でしょうか?
John F. Sowa著"Knowledge Representation"において、エージェントとは、意図的に何かをすることができる生体と定義しています。
生成AIでコーディングしたり、コーディングエージェントを使いこなすには以下roadmap.shの内容を理解しておく必要があります。
したがって、2025年5月22日現在は以下のプログラミング言語を学んでおくとアジリティの高い開発が見込めます。
- HTML (XML)
 - CSS
 - JavaScript (TypeScript)
 - Python
 - Go
 
Node.jsとnpmでJavaScriptやTypeScriptの開発環境を構築するのは非常に大変でしたが、最近は以下ランタイム、ツールのおかげで楽になりました。
- Deno
 - Bun
 - Biome
 
pipとrequirements.txtでPythonの開発環境を構築するのは非常に大変でしたが、最近は以下ツールのおかげで楽になりました。
- uv
 - Ruff
 
もちろん以下のプログラミング言語、Webアプリケーションフレームワークも学んでおいて損はないでしょう。
- PHP (Laravelなど)
 - C# (F#, .NET)
 - Ruby (Ruby on Railsなど)
 - Java (Kotlin, Scala, Spring Bootなど)
 - Rust
 - SQL (SQLite, PostgreSQL, MySQL)
 
シェルスクリプトも学んでおくといいでしょう。以下のようなものがあります。
- Bash
 - Zsh
 - Fish
 - PowerShell
 - Nushell
 
また、コーディングエージェントはGitとGitHubに強く依存していることが多く、コードレビューも必要になるため、以下の内容について理解しておく必要があります。
- GitHub Copilot
 - GitHub Codespaces (VS Code)
 - GItHub CLI
 
主に使用するGItHub CLIコマンドは以下のとおりです。
- gh auth
 - gh browse
 - gh codespace (gh cs)
 - gh gist
 - gh issue
 - gh org
 - gh pr
 - gh project
 - gh release
 - gh repo
 
コーディングエージェントへ以下Gitコマンドの内容を理解させることはとても重要です。
- git grep
 - git diff
 - git show
 - git log -p
 - git stash show -p
 - git reflog -p
 - git add -p
 - git worktree
 - git sparse-checkout
 
あとは以下IPA試験について学んでおくとAIや生成AIを使わなくても役に立つのでお得です。
- 情報セキュリティマネジメント試験
 - 基本情報技術者試験
 - 応用情報技術者試験
 
画像生成AI
生成AIの画像生成において最も使われるフォーマットは以下のとおりです。
- PNG
 - JPEG
 
PNGやJPEGだけでは表現できないケースもあるので、以下フォーマットを使います。
- SVG
 - GIF
 
PNGやJPEGより優れた以下フォーマットもあります。
- WebP
 - AVIF
 
最近はChatGPT, Gemini, Grok(xAI)で簡単に画像生成できますが、pixivで見るようなイラストを生成したいのであれば、以下SDXLモデルがベースになっているモデルをHugging FaceやCivitaiで探してみましょう。
- Animagine (Cagliostro Research Lab)
 - Illustrious (OnomaAI)
 - Pony (Stable Diffusion API)
 
また、新たにSDXLモデルを作ろうとすると、微調整に膨大なお金と時間がかかるため、もし作るのであればSDXLでLoRA学習を行うといいでしょう。
Stable DiffusionやNovelAIのような画像生成AIを使っていると、ものすごい数の画像が生成されるため、以下内容を理解しておくと管理が楽になります。
- アーカイブと圧縮
 - ハッシュとチェックサム
 
例えば7-Zipでは主に以下アーカイブと圧縮形式がサポートされています。
- 7z
 - BZIP2
 - GZIP
 - TAR
 - WIM
 - XZ
 - ZIP
 - ZSTD
 
他にも7-Zipでは主に以下ハッシュ関数とチェックサムがサポートされています。
- CRC32
 - CRC64
 - SHA1
 - SHA256
 - BLAKE2sp
 - XXH64
 
おわりに
ここまでの内容を完全に理解してやることがなくなったら以下のroadmap.shの内容を完全に理解すればいいと思います。
変更履歴
2025/06/02:
- 見出しを「コーディング」から「AIコーディングエージェント」へ変更
 - git worktreeとgit sparse-checkout、コードレビュー、LoRA学習について追加
 - 表記ゆれを修正
 
2025/06/05:
- エージェントの定義とJohn F. Sowa著"Knowledge Representation"のリンクを追加
 
2025/06/30:
- XMLとF#を追加
 
Discussion