💡

[2024年9月20日]週刊AI・WEB開発関連記事まとめ

Kai

2024/09/20に公開

こんにちは、Kaiです。

o1、来ましたね。Googleも次のモデルを準備しているという噂があるようです。

しかし、o1レベルになると人間の能力が追い付かず、その領域の専門家でなければ出力を検証できない問題が既に生じているとか。
また、サム氏の発言や後述の米国議会公聴会の内容にもとづいて、o1レベルのAIにより開発が加速しておりAGIは既に実現が確実視されているという見方もあるようです。
果たして人類はAGI後にどのような社会を迎えるのでしょうか。
では今週のトピックスです。
注意事項
直近収集したAIおよびWeb系の記事やポストが中心になります
私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
業務状況次第でお休みしたり、掲載タイミングが変わったりします

 Big Tech AIサービス
 OpenAI: o1最近はこの話題ですね。博士以上の専門性を持った回答を行うことができるとのこと。ただ、一般的な文系タスクや汎用タスクではGPT-4oの方が適しているそうで、科学的に高度な思考を必要とするタスクに向いているそうです。また、「o1はGPTではない」というOpenAIからの発言もあり、新しいアーキテクチャの可能性もあります。

特に注目すべきなのは、以下の図の通り、従来知られていた「学習に関するスケーリング則」に加えて「推論に関するスケーリング則」が提唱されていることでしょう。これは、学習に資源を投じるほど性能が向上するのと同様、推論に資源を投じるほど性能が向上する、という法則です。

https://openai.com/index/learning-to-reason-with-llms/

https://chatgpt-lab.com/n/ne6bae1edebfd?gs=7949e62a3246

 MS Copilot: The next phase of Microsoft 365 Copilot innovation一方、MSは365への次世代AI統合を発表。AIに指令を与えると自動的に最適な社内リソースを検索してパワーポイントを組み立てていく動画などは、ホワイトカラーの仕事内容に大きなインパクトを予感させます。

https://news.microsoft.com/m365-copilot-Sept-2024/

 Genspark: Introducing Genspark Autopilot AgentPerplexity超えと話題になっていたGensparkから、自動調査エージェントが登場。評判を見ていると賛否両論ですが、「クロスチェック」に特化した使い方が推奨されているようです。事例を見ても、何かを調査させるというよりも、ある仮説に対するファクトチェック的アプローチが多いですね。

https://mainfunc.ai/blog/genspark_autopilot_agent

 Qwen2.513モデルが一斉にリリースされました。ベンチスコアはいいものの、日本語の使用感はどうなんでしょうね。

https://x.com/Alibaba_Qwen/status/1836449414220779584

 その他AI系話題
 RAGで文書検索の精度を上げるには、複数の埋め込みモデルを使うRAG手法の一つ、「RouterRetriever」論文の解説です。分野に特化した埋め込みモデルを用意し、どのモデルを使うべきかを動的に選択する仕組みが提案されています。

https://zenn.dev/knowledgesense/articles/653229e5c37f4e

 約1720億パラメータ（GPT-3級）の大規模言語モデルのフルスクラッチ学習を行い、プレビュー版「LLM-jp-3 172B beta1」を公開国立情報学研究所 (NII）からの国産モデルです。学習データも全てオープンとしている世界最大のモデルとのこと。

https://www.nii.ac.jp/news/release/2024/0917.html

 医薬品検索にベクトル検索を導入したら、デフォで検索ニーズをほぼ満たせそうだった話めちゃくちゃ参考になりました。略語や剤形までベクトル検索で引き当てられるのですね。Qdrant使ったことないですが便利そう。

https://zenn.dev/minedia/articles/d9f01aa05bc880

 米国議会の公聴会で、AGIは最短1-3年後と想定され、社会は準備が出来ていないという発言最初の記事は全文起こしなので、動画の方が良さそうです。元OpenAI取締役の発言なので、注目されているようです。

https://www.techpolicy.press/transcript-senate-judiciary-subcommittee-hosts-hearing-on-oversight-of-ai-insiders-perspectives/

（動画）

https://x.com/tsarnick/status/1836243598213550355

 [2024/09/18]推薦・機械学習勉強会定例開催されている勉強会の記事シェアリンクです。3件ありますが、いずれも面白い記事でした。

https://github.com/wantedly/machine-learning-round-table/issues/266

 「深層学習の原理に迫る　数学の挑戦」 #書籍紹介書籍の概要をまとめていますが、普通にこれを読むだけでも勉強になります。本も良さそう。

https://stern-bow.hatenablog.com/entry/2024/09/18/192240

 RAGの処理で、リランクとベクトル検索でできることの違いを検証／解説してみるRAGでは併用するのがもう定説、みたいになっていますが、実際にサンプルデータで分かりやすく検証した例です。前述の医薬品検索ではベクトル検索が無双していましたが、自然言語の場合は文脈によって解釈が異なる場合があるので、リランク必須ですね。

https://acro-engineer.hatenablog.com/entry/2024/09/18/120000

 リーガルテックにおける検索・推薦技術法務文書という特殊領域で検索・推薦をどう実現するかというお話。契約書の親子関係を考慮したり、参考にすべき法文を推薦するなど、法務に特化したノウハウの一端が紹介されています。

https://speakerdeck.com/legalontechnologies/wakate-57-legalontech

 WEB開発系話題
 メールはツラいよ！！波乱のメールサーバAWS移行を振り返ってみるオンプレの環境をAWSに移行する際、GIPを移せなかったためIPレピュテーションを少しずつ構築しながら移行した、という事例です。ブロックされたトラブル事例の回避策などとても参考になります。

https://made.livesense.co.jp/entry/2024/09/17/080000

 新規サービス開発で起こったインフラ移行の舞台裏こちらはAzureからGoogle Cloudへの移行。ここまで情報出しちゃっていいんですか？というくらい詳しく書かれています。

https://zenn.dev/aishift/articles/f350167e896cab

 目的別データベースの実践: PostgreSQL 行レベルセキュリティと DynamoDB Outboxパターン医療機関向けクラウドという側面で、セキュリティのためにPostgreSQL、認証のためにDynamoDBなど、非機能要件のためにDBの使い分けをしているという事例です。

https://kakehashi-dev.hatenablog.com/entry/2024/09/19/110000

 その他一般テック話題
 テキストエディタをフルスクラッチで書いてみたvimでは？と思ったら最初に書いてありました。

https://qiita.com/sxclij/items/177af8d39e18bb536b0d

 renovateとDependabotの連携による脆弱性管理ライブラリの脆弱性対応パッチを検出し、PR作成までを一貫で自動的に行う事例。ちょっと試してみたい。

https://kakehashi-dev.hatenablog.com/entry/2024/09/06/110000

 インデックスとは何？MySQL(InnoDB)とPostgreSQLのインデックスの違いとは？調べてみました探索木は知っていましたが、MySQLとPostgreSQLの内部実装までは知りませんでした。勉強になります。

https://zenn.dev/calloc134/articles/4f96b0fe093489

CareNet EngineersPublication

株式会社ケアネットのエンジニアブログです。CareNetサービスの技術情報を中心に記事を投稿しております。各記事の内容は個人の意見であり、企業を代表するものではございません。

Discussion

ログインするとコメントできます

Big Tech AIサービス

OpenAI: o1

MS Copilot: The next phase of Microsoft 365 Copilot innovation

Genspark: Introducing Genspark Autopilot Agent

Qwen2.5

その他AI系話題

RAGで文書検索の精度を上げるには、複数の埋め込みモデルを使う

約1720億パラメータ（GPT-3級）の大規模言語モデルのフルスクラッチ学習を行い、プレビュー版「LLM-jp-3 172B beta1」を公開

医薬品検索にベクトル検索を導入したら、デフォで検索ニーズをほぼ満たせそうだった話

米国議会の公聴会で、AGIは最短1-3年後と想定され、社会は準備が出来ていないという発言

[2024/09/18]推薦・機械学習勉強会

「深層学習の原理に迫る 数学の挑戦」 #書籍紹介

RAGの処理で、リランクとベクトル検索でできることの違いを検証／解説してみる

リーガルテックにおける検索・推薦技術

WEB開発系話題

メールはツラいよ！！波乱のメールサーバAWS移行を振り返ってみる

新規サービス開発で起こったインフラ移行の舞台裏

目的別データベースの実践: PostgreSQL 行レベルセキュリティと DynamoDB Outboxパターン

その他一般テック話題

テキストエディタをフルスクラッチで書いてみた

renovateとDependabotの連携による脆弱性管理

インデックスとは何？MySQL(InnoDB)とPostgreSQLのインデックスの違いとは？調べてみました

Discussion

「深層学習の原理に迫る　数学の挑戦」 #書籍紹介