💡

[2024年9月27日]Advanced Voiceは魔法レベル(週刊AI)

2024/09/27に公開

こんにちは、Kaiです。
今週はBig Techの発表が相次いで話題に事欠かない時期でした。
一方WEB系のイベントがいくつかあったせいで、発表資料シェアも活発となりなかなか追いかけるのが大変でした。

サム氏のポエムから、AGI前夜という空気が一部で高まってきています。
人類は次のステージに向かうのか、それとも滅びに向かうのか……。

まぁ考えても仕方ないのでトピックスにいきましょう。

注意事項

  • 直近収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

Big Tech AIサービス

OpenAI: サム・アルトマン氏のポエム

2つの見方があって、こういったポエムを書くということは既にAGI/ASIが達成されており、あとは社会にそれをどう受け入れさせていくか、というフェーズに至ったというものが一つ。もう一つは、AGI/ASIへの道が遠いことが明らかになり、社会の興味関心を引き続けて投資を受けるための材料というもの。さてどちらでしょう。
https://ia.samaltman.com/

OpenAI: ChatGPT Advanced Voice Mode

これは5年前に存在していたとしても魔法レベルですよ。人間としゃべっているのと何の違いもない。英会話の訓練なんかには最適ですし、雑談もこなせる。
https://x.com/OpenAI/status/1838642444365369814

Meta: Llama 3.2公開

AIオープンモデルの雄、MetaからLlama3.2が公開。11B、90Bモデルはマルチモーダル化され、スマホなど向けの軽量モデルも登場。
https://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/

Google: Gemini新バージョン公開、価格は半額

最新プロダクトが、数ヶ月で性能向上した上に倍速かつ半額になるって普通に考えると頭のおかしい世界ですが、これがAI最前線……。
https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/

Molmo: MS共同創業者のアレン氏によるアレン人工知能研究所より発表

GPT-4o、Gemini 1.5 Pro、Claude 3.5をベンチマークスコアで凌駕するということですが、果たしてどうか。
https://x.com/allen_ai/status/1838956313902219595

その他AI系話題

生成 AI による新しい UI/UX 〜サーバーレスで実現する Generative UI の世界〜

現時点でのAWSを用いた実例です。そのうちサーバレスですらなく、アプリレス(全てのレスポンスをAIがオンデマンドに生成する)の時代が来るなどと言われていますが、その端緒を垣間見ているようです。
https://speakerdeck.com/gawa/generative-ui-with-serverless

話題のGraphRAGにAWSで挑戦しよう!(LlamaIndexとNeptuneに入門)

GraphRAG、AWS環境だとこんなに簡単に実装できるのですね。自前でやるよりはだいぶ早そう。
https://qiita.com/minorun365/items/a62dec701bef17cf7562

ArXivから論文を参照してLLMをColabでファインチューニングしてみる。

Gemma2b-itをLoRAで1000ステップのサンプル。これくらいなら気軽に試せますが、がっつりとなるとやはりRAGが第一選択になりそう。
https://bwgift.hatenadiary.jp/entry/2024/09/23/220903

Embeddingはコンテキストの保持で精度が上がる

チャンキングの過程で文脈が失われるケースに対応するための手法紹介。できるだけ長くトークンを放り込んで、トークンごとにEmbeddingを取得、チャンクごとに平均化という方法です。シンプルですが、効果も限定的に見えるかな?
https://zenn.dev/knowledgesense/articles/bb7a4943e228f6

Introducing Contextual Retrieval

Anthropic公式。RAGにBM25(TF-IDF)を組み合わせる手法で大きく性能が向上するとのこと。TF-IDFが未だに各所で有効なのは驚くべきことです。
https://www.anthropic.com/news/contextual-retrieval

WEB開発系話題

コンポーネントテストの手法と その効果を考える

フロントエンドのコンポーネントテストライブラリを総ざらいして比較したスライド。実コードもあって検討する際のよい材料になりそうです。
https://speakerdeck.com/yotahada3/frontend-component-test

AWS Lambda Web Adapterを活用する新しいサーバーレスの実装パターン

寡聞にして知りませんでした。これを使うと、非LambdaのWebアプリをそのままLambdaに乗せられるそうです。
https://speakerdeck.com/tmokmss/aws-lambda-web-adapterwohuo-yong-suruxin-siisabaresunoshi-zhuang-patan

静的サイトのCI/CDでも侮るなかれ!Docs as Codeに沿ったセキュアな開発プロセスの実践

静的サイトを題材にしていますが、普通にCI/CDのベストプラクティスとしてよくまとまったスライドです。
https://speakerdeck.com/mhrtech/secure-docsascode-cicd-for-static-sites

API教に入信しよう【REST APIの教え】

オライリー・ジャパンの「The Web API」の冒頭を分かりやすく解説。使いやすいAPIとはどうあるべきか、の基本的な部分です。
https://qiita.com/haruki-lo-shelon/items/4dae497ca51a1caaf2b5

経験値ゼロから始める A_B テスト布教活動と意思決定に活かしやすいA_Bテスト設計の一案

日経においてゼロからA/Bテストを導入した経緯と学びが前半、後半は理論寄りのテスト設計の内容です。前半はどういうステップで社内に浸透させたかがかなり参考になります。
https://speakerdeck.com/taro_masuda/brainpad-meetup-20240919

AWS CodeCommitの次として考えた場合のAmazon CodeCatalyst

CodeCommitがEOLに向かっている前提で、CodeCatalystに乗り換える場合の概観。結構入り口から違うんですね。
https://speakerdeck.com/satoshi256kbyte/aws-codecommitnoci-tositekao-eta-chang-he-noamazon-codecatalyst

1000万DL人を支えるiAEONアプリ:完全停止を防ぐ耐障害性の設計

イオンのアプリ設計のお話。キャッシュ化、モジュール化を徹底し、通信不能でもサーバが落ちても最低限使えなければいけない機能を活かす、という発想。とても参考になります。
https://speakerdeck.com/aeonpeople/iaeon-app-supporting-10-million-users-fault-tolerant-design-to-prevent-complete-outages

Curated collection of A/B test results from best-in-class apps

めちゃくちゃたくさんのA/Bテスト結果が掲載されているサイト。構成を考えるときのヒントに。
https://abtest.design/

AWS CDKを用いたセキュアなCI/CDパイプラインの構築

cdk-nagとCheckovというライブラリを使い、CI/CDパイプラインに統合することでCDKの多面的セキュリティチェックを自動化。
https://speakerdeck.com/seike460/cd-pipeline-using-aws-cdk

その他一般テック話題

グーグルやMSら警鐘、生成AIでITエンジニアは不要になる?「90%以上影響」の詳細

V0やCreateを触っていると、エンジニアの役割が変質していくことは避けられないように思います。
https://www.sbbit.jp/article/cont1/148536

不要な処理が実行速度を速くする謎を追う

技術的に面白い内容でした。無駄なHash生成をするとなぜか速度が上がるという問題で、ヒープ領域の広がりとガベージコレクション頻度がどうやら答えだったらしいとのこと。
https://moneyforward-dev.jp/entry/2024/09/26/removing-steps-makes-it-slower

CareNet Engineers

Discussion