💡

[2024年7月26日]週刊AI・WEB開発関連記事まとめ

2024/07/26に公開

こんにちは、Kaiです。
ビッグテックが急に動いた週でしたね!
Meta、Mistral、Google、OpenAIと次々に発表がありました。あくまでスコア上の話ですが、オープンモデルがついに商用最高モデルに追いついた、というのは一つの節目になりそうです。
一方、先行しているGoogle、OpenAIなどは、単純なモデル性能ではなくその応用にシフトしているように思います。ただ資金面での懸念もあり、AIバブルが弾けるのでは……?という空気も出てきている印象です。

ではトピックスいってみましょう。

注意事項

  • 先週収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

特定AIサービス

Meta: Llama3.1

Llamaの405Bモデルがバージョン3.1として登場。画像の通り、商用最高レベルのモデルと同等の性能を示しています。ただとても残念なのが、バージョン3.1から日本語がサポート言語から外されました。どうやら日本語での受け答え自体はできるようですし、PEFTしたモデルも公開されていますが、事前学習で日本語向けのチューニングはされていないということなのでしょう。
これは日本語話者である私たちにとって大きなインパクトであり、AI競争の中で取り残されないよう国内投資や拠点誘致などが必要だと感じます。

https://ai.meta.com/blog/meta-llama-3-1/

Mistral: Mistral Large 2

Llama3.1のすぐあとに、Mistralも新モデル発表。123Bであり、パラメータ数-性能比でいうと最高レベルとのこと(画像参照)。こちらは日本語をサポートしています。

https://mistral.ai/news/mistral-large-2407/

Google: 国際数学オリンピック(IMO)で銀メダルレベルの複合AIシステム

数学的推論に特化したAlphaProofと、幾何学に特化したAlphaGeometry2を組み合わせることで、人間最高レベルの数学的能力に達しているとのこと。特化した問題解決は限界に近いところまで言っていますが、「問いを立てる」方はどうなんでしょうね。

https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

OpenAI: SearchGPT Prototype

Googleの発表の直後に出してきました。AIとWeb検索を統合したサービスという触れ込みです。相変わらず見せ方がうまい。というかこれ、そのまんまPerplexityでは……?
https://openai.com/index/searchgpt-prototype/

その他AI系話題

メール地獄からの解放:AI完全自動メール返信生成システム(by ChatGPT研究所)

ChatGPT研究所が出したAI自動メール返信生成システムに対する、医師の感想です。大幅にメール業務の負荷が下がったとのこと。ただ、記事中にも言及があるように業務で使うには注意が必要です。企業の場合、メールの内容は営業秘密やインサイダー情報になり得てしまう可能性があり、そのままの形での導入は難しいでしょう。
https://note.com/genkaijokyo/n/n51f20bf6bfba

ヘルプデスクの事例で学ぶAIエージェント

AIエージェントという言葉は様々な意図で使われていますが、それを総括した上でヘルプデスクでの事例を取り上げているスライド。大変分かりやすいです。
しかしこれ、業務分析→要求定義→設計→データ整備というプロセスが全てという観点では、これまでのシステム開発と抽象レイヤーでは同じことなんですよね。AIでより高度な処理ができるというだけで。
https://speakerdeck.com/masatoto/herupudesukunoshi-li-dexue-buaieziento

RAGで複数のLLMを使う「Speculative RAG」の解説

類似度の高いドキュメント群を別々の小規模モデルに渡してRAGし、出力を大きいモデルで評価する、という手法です。FTでも似たような手法が提案されていましたね。
https://zenn.dev/knowledgesense/articles/c9c50ae37f2ebf

Google、アプリ実行時に生成AIが適切なUIを構成し動的生成する「AI Generated UI」発表

オンデマンドで適切なUIをその場で生成するという概念。Claude Artifactsで瞬間的にUIが生成されるのを見ていると、さもありなんという未来です。そのうち、ソフトウェア自体がオンデマンドの使い捨てになる可能性も感じます。
https://www.publickey1.jp/blog/24/googleaiuiai_generated_ui.html

大規模言語モデルを用いたマイソクPDFからの情報抽出

PDFから情報を抽出する際、OCR+LLMの組み合わせが精度が高いという報告です。以前書いた記事の通り、体感的にもやはり餅は餅屋ということかと。ただ、今後のAIサービスは裏側でエージェントが動くようになるはずで、自動的に必要なサービスを呼び出して組み合わせるところまで進むと思います。
https://www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/P10-7.pdf

(過去記事)
https://zenn.dev/carenet/articles/a427e33a3dcabe

RAGのサービスをリリースして1年3ヶ月が経ちました

黎明期からRAGを利用したサービスを開発している方の振り返り。バズワードになっているが決して万能ではないことに注意すべき、というのはその通りですね。
https://speakerdeck.com/segavvy/ragnosabisuworirisusite1nian-3keyue-gajing-timasita

WEB開発系話題

今さら聞けないログの基本と設計指針

やや昔の記事ですが、ログ系総まとめとして大変分かりやすくまとまっていたのでご紹介。特にVMやDockerベースのログについては勉強になります。
https://qiita.com/tadashiro_ninomiya/items/19c774898c68add6185e

Chrome、サードパーティCookieの廃止を廃止

まぁ、難しいだろうなと思ってはいましたが、やはり。結局Googleも広告企業ですからねぇ。
https://privacysandbox.com/intl/en_us/news/privacy-sandbox-update/
(日本語解説)
https://www.itmedia.co.jp/news/articles/2407/23/news082.html

その他一般テック話題

Looker Studioの魅力と便利な使い方を紹介します

当社でも一部使っていますが、ここまで網羅的な記事は初めてかも。全然知らなかったこともたくさんあるので、工夫して使っていきたいところです。
https://www.yasuhisay.info/entry/2024/07/22/082233

CareNet Engineers

Discussion