💡

[2024年6月28日]週刊AI・WEB開発関連記事まとめ

2024/06/28に公開

こんにちは、Kaiです。
Anthropicがすごい攻勢をかけてきていますね!
Claude3.5 Sonnetに続き、ArtifactsにProjectsと、単なるLLMの枠を超えて「仕事」をサポートしていくのだという意思を感じます。
Artifactsはさっそく業務でのちょっとしたものを作る際に活用していますが、明らかに速度が何倍にもなっていることを感じます。Anthropicは6月21日に自民党の勉強会で「6~18か月以内に、産業が根本的に変革される」というような発表をしており、今後も次々に新しいものを打ち出してくると思われます。

翻って、OpenAIはちょっと最近振るわないですね。確かにGPT-4oは興味深かったですが、一時期の圧倒的な勢いはないように感じます。

さて、そんな巨人たちの戦いを眺めながら、今週のトピックスいってみましょう。

注意事項

  • 先週収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

特定AIサービス

Claude: Artifacts

これはLLMを使う体験としてすごく新しく感じました。これまでワンクッション置いていたものが、シームレスになったと言えばいいんでしょうか。作ったものがすぐ形になり、それを見ながらやり取りしていけるというのはUXとして素晴らしかったです。
https://note.com/kajiken0630/n/n88bdb727f3a9

Claude: Projects

こちらはOpenAIのMy GPTsに近いものですが、チーム内で共有できるということで、恐らく共同作業・共同創作といった目的にふさわしいのでしょう。OpenAIが共同作業ツールを出していたスタートアップのMultiを買収したというニュースもありますし、今後のAIはそちらに舵が切られていくのかもしれません。
https://www.watch.impress.co.jp/docs/news/1603204.html

(関連情報) OpenAI、企業向けWeb会議ツールのMultiを買収
https://www.itmedia.co.jp/news/articles/2406/25/news110.html

Gemini: 「Gemini 1.5 Pro」がGmailやGoogleスプレッドシートなどに統合

統合されるのはいいですが、気付かないうちに情報が抜かれてるとか……と考えると怖いものがあります。やはりMSやGoogleなど、既存サービスを持っているところは統合方針ですね。
https://pc.watch.impress.co.jp/docs/news/1602868.html

その他AI系話題

「GPT-4」を上回る日本語性能のLLM「Llama-3-ELYZA-JP」を開発しました

松尾研から日本語特化のオープンLLMです。70Bと8Bがあり、8Bは一般公開されています。8Bだと無理なくローカルで動かせるので、そのうち検証記事も書きたいところです。
https://note.com/elyza/n/n360b6084fdbd

Instruction Pre-Training: Language Models are Supervised Multitask Learners

教師ありのインストラクションデータを用いた事前学習によって、大幅にモデル性能が向上するとのこと。こちらの主張によれば、Llama3-8BをLlama3-70Bに匹敵するか、上回るほど強化できるそうです。やはり精度の高い学習データが重要、ですかね。
https://huggingface.co/papers/2406.14491

決定木の理論とフルスクラッチ実装とその解説

scikit-learnにあると中身をあまり考えずに使ってしまいがち。ということで改めて決定木を勉強するのにとてもよい記事でした。コード解説もしてほしいな!
https://tomtom58.hatenablog.com/entry/2024/06/23/210857

[翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜

必読です。英語記事の翻訳ですが、LLMをプロダクトに組み込むために試行錯誤したノウハウをめちゃくちゃ詳しく解説してくれています。実際、私たちのチームが悩んでいることへのヒントもかなりありました。
https://zenn.dev/seya/articles/12c67b5d80670a

70B-parameter large language models in Japanese medical question-answering

プレプリント。医療領域の日本語LLMはまだ少ないですが、70B日本語モデルに日本語の医療問題-回答データセットでインストラクションチューニングし、国家試験での正解率を50%超まで向上できたとのこと。ローカルで動かせる70Bモデルでこの性能は、今後に期待できますね。
https://arxiv.org/abs/2406.14882

WEB開発系話題

systemdにバグ./home以下のファイルが全削除される可能性あり

脆弱性ではなく、純粋にバグです。バージョンチェック必要。
https://pyopyopyo.hatenablog.com/entry/2024/06/24/180000

その他一般テック話題

生成AIの進化でウェブ制作会社が消える可能性があるという話

ウェブ制作会社の中の人がこれを書いているというのはすごいですね。確かに、Artifactsを触っていると、60点から70点の出力は10分の1の労力で出来てしまう感触があります。
https://baigie.me/officialblog/2024/06/26/web_production_crisis/

自分専用AIを作る グーグル「NotebookLM」を家電取説・辞書・時刻表で使う

応用例なのでこちらに。「おうちAI」的な発想はとても面白いです。家族で箱を共有して、みんなの共有知を集めていくというような使い方もできそうです。
https://www.watch.impress.co.jp/docs/topic/1602337.html

CareNet Engineers

Discussion