🗞️

今週の生成AI情報まとめ(8/26~9/1)

2024/09/01に公開

こんにちは、ナウキャストでLLMエンジニアをしているRyotaroです。
8/26~9/1で収集した生成AIに関連する情報をまとめています。

※注意事項

内容としては自分が前の週に収集した生成AIの記事やXでの投稿・論文が中心になるのと、自分のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります

ちょっと忙しくて今週は少なめです💦

それでは行きましょう

Haystack Editor

VSCode から Fork した Cursor とは別の新しい IDE。
Y Combinatorのプログラムに参加しているUSのエンジニア2人が開発している

ファイル間の依存関係を可視化しながら編集できるUIになっている

9/1時点でhomebrewによるインストールは不可。直接公式サイトからダウンロードする必要がある。
https://d2dv27o1k99orf.cloudfront.net/Haystack+Editor+Apple+Silicon-0.15.dmg

データ漏洩の点は大丈夫そう。cursor プライバシーモードがデフォでTrueな感じ。

Does Haystack log or send my code anywhere?
We do not store ore log your code anywhere. We do sedn snippets of your code to Open AI as input for our navigational copilot if you opt into it. BY default, you are opted out.
Haystackは私のコードをどこかに記録したり送ったりしますか?
あなたのコードをどこかに保存したり、ログに残すことはありません。私たちは、あなたがそれを選択した場合、私たちのナビゲーション・コパイロットの入力として、あなたのコードのスニペットをOpen AIに送信します。デフォルトではオプトアウトされています。

世間の評判では「これを使うには広いモニタが必要」という声が多いらしい

Xでは結構厳しい意見も…

がっつり激しく使った感想:
画面の無駄が増えがち、ウィンドウ内ウィンドウの挙動、フォーカス制御、ショートカットキーなどがVSCodeとかち合っておかしくなったり、そもそもバギーな動きすることがある。ウィンドウのサイズがいらんタイミングで伸び縮みしたり、重なりあったウィンドウの順番がおかしくなりがち。基礎部分がなってない。これなら、VSCode/Cursorなりでやった方がまし

特定の目的に使えそう:
40inchとか60inchとかのどでかい画面を使って、チームでコードリーディングするとかって時にはめちゃくちゃ便利かも。コードを分析しながら都度適当にテキストを追加したりする。

つまり、開発には向かないが、コードリーディングとかには良い。そういう意味では不慣れなリポジトリを探索するときにはありかもしれない??ただしどでかい画面が大前提。小さい画面なら素直にCopilot ChatとかCursorに分析させろ

参考資料

https://haystackeditor.com/
https://laiso.hatenablog.com/entry/2024/08/25/180631
https://qiita.com/sigma_devsecops/items/906c01de696af10fd73e
https://x.com/erukiti/status/1829697633759477992

SAMMO: 迅速な最適化のための汎用フレームワーク (4/18)

Microsoftは2024/4/18にSAMMO(Structure-Aware Multi-objective Metaprompt Optimization)の研究を発表。

参考資料

https://www.microsoft.com/en-us/research/blog/sammo-a-general-purpose-framework-for-prompt-optimization/
https://gihyo.jp/article/2024/04/sammo
https://zenn.dev/iku/scraps/e469c94d4a1540

NVIDIA が日本版生成 AI の開発支援 (8/26)

日本が生成 AI の開発国として重要視されていることがわかる。
母校である東工大に支援が入るのはちょっと嬉しい。

企業向けの生成AI(人工知能)の開発支援サービスを拡充し、日本語への対応力を高めた東京工業大や楽天の基盤モデルを新たに扱うと発表した。重要インフラの保護や産業競争力の強化において、人材やデータなどを他国に頼らない態勢を構築し、経済安全保障を強化する取り組みをサポートする。

参考資料

https://newspicks.com/news/10455448/body/
https://note.com/vangsow/n/n8617ad95bf7b

日立が顧客特化のLLMを作成するサービスを開始することを発表

日立製作所は8月29日、顧客の業務ごとに最適化した大規模言語モデル(LLM)の構築と継続的な改善を支援するサービスを10/1から始めると発表。

主にオンプレミスでの生成AI導入をサポートするとのこと。(オンプレ?まじか)

発表に先立ち、社内で実証実験を行った。同社のIT運用管理ソフトウェアである「JP1」の認定コンサルタント試験に業務特化型LLMで挑戦した。JP1のマニュアルや試験の受験者向け研修テキストなどでファインチューニングを実施。試験ではRAGを用いて問題に回答させた。結果、オープンLLMや商用LLMでは合格できなかったが、業務特化型LLMのみが試験に合格できたという。

参考資料

https://www.itmedia.co.jp/aiplus/articles/2408/29/news198.html

Discussion