主観的AIの歴史2020〜2025
↑ AI成形バージョン
客観的な歴史は、インターネット上に残り続けるだろう。
しかし、無機質な年表を見て心躍る人はどれだけいるだろうか。
歴史の授業で眠くなりながら聴いていた「何年に何が起こった。なんたらこんたら〜」
何が面白いのか自分にはわからない。
客観的な歴史を学ぶのが、社会科
なのだとしたら、主観的な歴史を学ぶのが国語だと思う。
羅生門は特にそうだろう。
災害の2時被害をあそこまで克明に描いた作品があっただろうか?
カツラおばさんザマーみろ
という話ではなく、
災害によって、少しずつ街が痩せこけ、婆さんや下人が仕事をなくし、
行き場のない悲しみ、不安をぶつけ合う。
そのようなすごく惨めな話であると自分は解釈した。
なので主観でAIの歴史を記すべきだと思った
以下本文
主観によるAIの歴史
私の年齢は20歳。
5年前、コロナが流行ったぐらいの時は、中学生で囲碁のAIがすごいみたいなレベル感だった。将棋もいけるかもみたいな感じで。
簡単なゲームであれば勝手にクリアできるかもみたいな感じだった。
そこから2年後2022年
チャットGPT3、5がリリース。
今までのチャットbotではありえない流暢な日本語。
これにすごく驚いた記憶がある。
何かに使えるということはあまり考えていなかった。
それまではチャットbotが主流で、日本語を自然に話せるようなものはなかった。
その当時、私は高校生でゲームを趣味で作っていた。
わからないことがあったら聞いたりしていた。一発でエラーなしのコードが出ることはあまりなかった。エラーが出ないにしろ、あまり使えたものではなかった。
ですが、日本語を流暢に話すそれを見て、自分はすごく感心したというか、なんというか驚いたんです。
画像生成の分野では、ノイズが多いが、猫とはわかるようなレベル感の画像が生成できるような感じだった。
ドット絵レベルにしたら破綻はほぼわからない感じだったと思う。
人だと、
指はいっぱい生えたり、2本しかなかったり、足は先がなかったり。
その後、敵対的ネットワークGANの技術が出て、急激にクオリティの高い画像が生成できるようになった。
ミッドジャーニーを課金して少し触ったのが懐かしい。
ウェブ系のUIイメージを作成するとすごくいい感じのが出てきて、テンションが上がった記憶がある。
テキスト生成に話を戻す。
cursorが出て、ゲームを作るのに利用した。
その当時どんなモデルを触っていたかは覚えていないが、300行くらいのコードを書くのが精一杯だった記憶がある。
記憶領域が3000トークンだったかな?
少ない。
今は128Kトークンだから40分の1。
そうは言っても最近でも既存のコードの改修はうまくいかなかった記憶がある。
ずっと苦手なのかもしれない。
当時はゲームを作るために利用していた。
貧弱なAIなため、コード量が多くなるとすぐに破壊的にコードを変更し始める。
そうするともう手がつけられない。なので、その当時から、生成されたコードがどのように実装されているかを調べたり、AI自身にどのような実装をしたのかを聞く必要があった。
AIが完全に舵取りをしない限り、AIを使う人はコードを理解する必要があると思う。
しかし、
その理解の深さが少し浅くても良くなった気がする
今までは理解しており、かつ実装できる力が必要だったが、使い方を知っているだけで良くなった。例えるなら、画像の拡張子のようなものだ。
背景を透過したいならpngですし、容量を抑えたかったらJPEGです。
どう言った用途で何を使うのかを知っていればあとはそれで保存すればいいわけです。どのように内部で処理されているかということがわからなくても、使い分けることができますね。
AIによって、その範囲が広がったというわけです。
なので、知っておく。
これが重要なんです。
よく、調べてわかるようなことは覚えなくていいと言われますが、知らんことは調べることもできません。
なので最低限の情報は知っておく必要があると考えます。
なんの話をしていたんでしたっけ?
そうです。
cursorの話ですね。
AIを使いこなすとしても、コードの理解は必要であるという話でしたね。
なんだかんだそのあとはあまりAIは触りませんでしたね。徐々にフェードアウトしていきました。
コードの修正が下手すぎて使い物にならなかったので、調べてコピペする形に戻ってしまいました。
エラー内容を投げて、教えてもらうということはしてましたがガッツリ使うということは少なかったです。
そのあとはどんな感じだったかな?
画像生成だとネガティブプロンプトように手足がしっかり生成されていないものを学習させて、ネガティブプロンプトに突っ込むような手法があったりしましたが、画像生成をガッツリやっていたわけではないので正直よくわかりません。
音楽系やボイス系のAIが伸びてきて、
弥助やないかい
とかは結構バズってましたね。
時事ネタ×生成AI
のいい例だと思います。
あとはずんだモン。
どの動画もずんだもん
ゆっくり実況 量産時代から
ずんだモン量産時代にシフトしていった感じがありますね。
結構クオリティが高くなってくると、
既存の職業の方がよく思わない例が増えてきた感じがしていますね。
声優の声をサンプルとして、
ほぼ同じ声で声を生成できるソフトだったり、
LoRaを用いて似たタッチの絵を量産できたりと、
悪用ができてしまうレベルのAIが生まれてきました。
声を真似ることができる技術は成りすましであったり、言ってもいないことを言わせることが可能なため、大きな問題になりました。
画像生成に関しては、盗作が多く出てこちらも問題になりました。
そもそも盗作はいけないのでAI以前の問題ですが。
そう言ったことが起きたため、AIをよく思わない人が特にイラスト関連で多く見られました。
この人たちを反AIと呼ぶことにします。
AIを反対している人の略です。
まず、そもそも盗作はダメです。
その上で、学習に使っていいのか。
これが論点なのですが、人と同じです。
学習はしていいです。
その代わり恣意的に、故意に似せる行為は法に触れる可能性があるというのが自分の認識です。使う人間に責任があるだけなので、生成AIは関係ありません。
包丁と同じです。
ただ、コンテンツ自体が飽和しているため、被ることはこれから多くなっていくでしょう。
名前は50音しかないのでもうすぐ埋まりますね。
ポケモンの名前が年代を重ねるごとにへんになっていくのがそれを証明しています。
美しいと感じるものは大体皆同じです。
似たようなものが量産されるでしょう。
そのため、何を作ったかでは評価できない時代になったような気がしています。
誰が作ったか、なぜ作ったかが重視される時代になっていくのだと思います。
deepseek R1の到来
これはすごかったですね。
動くコードが一発で出る。
そして破格の安さ。
ここら辺から、AI関連の開発競争が激化したような気がします。
それまで半年に一回みたいなペースだったにも関わらず急に月一ペースで新しいものがでてくるようになった。
触った感触はすごく良かった。
ソフト開発ができそうな感触だったので、R1を使ってvisual studioでかんたんなツールを作るようになった。
調べて実装する場合に比べて開発スピードは10倍以上。
エラーが出た時の対処ができるのがやはりとても嬉しかった。
日本語で調べても出てこないようなエラーでもどこから見つけてきたかわからない知識で解決してくれる。
すごくありがたい。
マークダウンエディタやその他いろいろなツールを作ったが、AIがなかったらまだ一つも完成していなかったと思う。
一つの小さなエラーでつまずいて、
調べても出てこず、
やっと解決した頃には
やる気自体がなくなっている。
そんな感じになってしまうのではないか。
あとは、ちょっとしたアイデアを形にする時。
サクッと試作を作ってくれるので心理的負荷が少ない。
私の主観AIの歴史はこんな感じです。
最近は週一で新しいのが出るのでもう諦めています。
2025年03月27日
chatGPTの画像生成がすごい!!
というニュースとdeepseekv3の新しいやつがすごいというのは、知っている感じですね。
MCPやらなんやらはもうわかりません。
Ollamaみたいなのが出たら教えてください
そんな感じですね。
以上です
長文を読んでくださりありがとうございました😊
Discussion