[2024年9月27日]Advanced Voiceは魔法レベル(週刊AI)
こんにちは、Kaiです。
今週はBig Techの発表が相次いで話題に事欠かない時期でした。
一方WEB系のイベントがいくつかあったせいで、発表資料シェアも活発となりなかなか追いかけるのが大変でした。
サム氏のポエムから、AGI前夜という空気が一部で高まってきています。
人類は次のステージに向かうのか、それとも滅びに向かうのか……。
まぁ考えても仕方ないのでトピックスにいきましょう。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
Big Tech AIサービス
OpenAI: サム・アルトマン氏のポエム
2つの見方があって、こういったポエムを書くということは既にAGI/ASIが達成されており、あとは社会にそれをどう受け入れさせていくか、というフェーズに至ったというものが一つ。もう一つは、AGI/ASIへの道が遠いことが明らかになり、社会の興味関心を引き続けて投資を受けるための材料というもの。さてどちらでしょう。
OpenAI: ChatGPT Advanced Voice Mode
これは5年前に存在していたとしても魔法レベルですよ。人間としゃべっているのと何の違いもない。英会話の訓練なんかには最適ですし、雑談もこなせる。
Meta: Llama 3.2公開
AIオープンモデルの雄、MetaからLlama3.2が公開。11B、90Bモデルはマルチモーダル化され、スマホなど向けの軽量モデルも登場。
Google: Gemini新バージョン公開、価格は半額
最新プロダクトが、数ヶ月で性能向上した上に倍速かつ半額になるって普通に考えると頭のおかしい世界ですが、これがAI最前線……。
Molmo: MS共同創業者のアレン氏によるアレン人工知能研究所より発表
GPT-4o、Gemini 1.5 Pro、Claude 3.5をベンチマークスコアで凌駕するということですが、果たしてどうか。
その他AI系話題
生成 AI による新しい UI/UX 〜サーバーレスで実現する Generative UI の世界〜
現時点でのAWSを用いた実例です。そのうちサーバレスですらなく、アプリレス(全てのレスポンスをAIがオンデマンドに生成する)の時代が来るなどと言われていますが、その端緒を垣間見ているようです。
話題のGraphRAGにAWSで挑戦しよう!(LlamaIndexとNeptuneに入門)
GraphRAG、AWS環境だとこんなに簡単に実装できるのですね。自前でやるよりはだいぶ早そう。
ArXivから論文を参照してLLMをColabでファインチューニングしてみる。
Gemma2b-itをLoRAで1000ステップのサンプル。これくらいなら気軽に試せますが、がっつりとなるとやはりRAGが第一選択になりそう。
Embeddingはコンテキストの保持で精度が上がる
チャンキングの過程で文脈が失われるケースに対応するための手法紹介。できるだけ長くトークンを放り込んで、トークンごとにEmbeddingを取得、チャンクごとに平均化という方法です。シンプルですが、効果も限定的に見えるかな?
Introducing Contextual Retrieval
Anthropic公式。RAGにBM25(TF-IDF)を組み合わせる手法で大きく性能が向上するとのこと。TF-IDFが未だに各所で有効なのは驚くべきことです。
WEB開発系話題
コンポーネントテストの手法と その効果を考える
フロントエンドのコンポーネントテストライブラリを総ざらいして比較したスライド。実コードもあって検討する際のよい材料になりそうです。
AWS Lambda Web Adapterを活用する新しいサーバーレスの実装パターン
寡聞にして知りませんでした。これを使うと、非LambdaのWebアプリをそのままLambdaに乗せられるそうです。
静的サイトのCI/CDでも侮るなかれ!Docs as Codeに沿ったセキュアな開発プロセスの実践
静的サイトを題材にしていますが、普通にCI/CDのベストプラクティスとしてよくまとまったスライドです。
API教に入信しよう【REST APIの教え】
オライリー・ジャパンの「The Web API」の冒頭を分かりやすく解説。使いやすいAPIとはどうあるべきか、の基本的な部分です。
経験値ゼロから始める A_B テスト布教活動と意思決定に活かしやすいA_Bテスト設計の一案
日経においてゼロからA/Bテストを導入した経緯と学びが前半、後半は理論寄りのテスト設計の内容です。前半はどういうステップで社内に浸透させたかがかなり参考になります。
AWS CodeCommitの次として考えた場合のAmazon CodeCatalyst
CodeCommitがEOLに向かっている前提で、CodeCatalystに乗り換える場合の概観。結構入り口から違うんですね。
1000万DL人を支えるiAEONアプリ:完全停止を防ぐ耐障害性の設計
イオンのアプリ設計のお話。キャッシュ化、モジュール化を徹底し、通信不能でもサーバが落ちても最低限使えなければいけない機能を活かす、という発想。とても参考になります。
Curated collection of A/B test results from best-in-class apps
めちゃくちゃたくさんのA/Bテスト結果が掲載されているサイト。構成を考えるときのヒントに。
AWS CDKを用いたセキュアなCI/CDパイプラインの構築
cdk-nagとCheckovというライブラリを使い、CI/CDパイプラインに統合することでCDKの多面的セキュリティチェックを自動化。
その他一般テック話題
グーグルやMSら警鐘、生成AIでITエンジニアは不要になる?「90%以上影響」の詳細
V0やCreateを触っていると、エンジニアの役割が変質していくことは避けられないように思います。
不要な処理が実行速度を速くする謎を追う
技術的に面白い内容でした。無駄なHash生成をするとなぜか速度が上がるという問題で、ヒープ領域の広がりとガベージコレクション頻度がどうやら答えだったらしいとのこと。
Discussion