Technology Radar vol.31 の個人用サマリ
はじめに
本日 2024/10/24 Technology Radar の vol.31 が公開されました。
全体的に軽く知っておこうと思い、ダウンロードした PDF を、最近公開された Claude の Sonnet 3.5 New を使いサマライズしました。
見出しだけだとそれがどのようなものなのかが分かりづらかったので、キャッチコピーを ChatGPT の canvas 機能を使ってつけ加えています。
免責事項
Techniques
初期導入の安全地帯 - 1% canary (Adopt)
-
カナリアリリースの一種で、新機能を約1%の慎重に選択されたユーザーグループに展開
-
早期フィードバックの取得とリスク軽減を同時に実現
-
特にモバイルアプリケーションやエッジコンピューティングデバイスのアップデートに重要
-
問題が発生した場合の影響範囲を最小限に抑えることが可能
-
ユーザーカテゴリー全体から適切なサンプリングを実施
フロントエンドの堅実な守り手 - Component testing (Adopt)
-
フロントエンドのコンポーネントレベルでのテストを重視する手法
-
jsdomなどを使用してメモリ内でテストを実行し、高速で安定したテストを実現
-
ブラウザベースのE2Eテストやユニットテストの中間に位置する
-
不必要な内部実装の露出を避けつつ、効果的なテストカバレッジを達成
-
テストピラミッドやテストトロフィーの重要な層として位置づけ
すべてを本番へ - 継続的デプロイの未来 - Continuous deployment (Adopt)
-
自動化されたテストをパスした全ての変更を自動的に本番環境にデプロイ
-
Continuous deliveryとは異なり、全ての変更を必ず本番環境にデプロイ
-
迅速なフィードバックループの実現と顧客価値の早期提供を可能に
-
高度な成熟度が必要とされるため、全てのチームに適用できるわけではない
-
Valentina Servileの書籍が実装のための包括的なガイドを提供
応答精度を高める知識の架け橋 - Retrieval-augmented generation (RAG) (Adopt)
-
LLMの応答品質を向上させるための確立されたパターン
-
関連文書の内容をプロンプトに追加することで、より正確な応答を生成
-
ベクトルデータベースと組み合わせて使用されることが多い
-
幻覚(ハルシネーション)を大幅に削減可能
-
コードベースの理解にも効果的に活用可能
物語でドメインを理解する - Domain storytelling (Trial)
-
DDD(ドメイン駆動設計)の初期モデル構築のためのファシリテーション技法
-
ビジネスエキスパートに活動を説明してもらい、絵文字のような言語でキャプチャ
-
関係性やアクションを視覚化することで、参加者間の共通理解を促進
-
Event Stormingの代替または補完として機能
-
DDDの開始点として効果的な手法
埋め込みモデルに磨きをかける - Fine-tuning embedding models (Trial)
-
RAGベースのアプリケーションのための埋め込みモデルの微調整手法
-
特定のタスクやドメインに対して、より正確な埋め込みを生成
-
文書の検索精度と応答品質の向上に貢献
-
ドメイン特化型LLMアプリケーションで特に有効
-
トレードオフを慎重に検討する必要がある
LLMと外部ツールを自在に操る - Function calling with LLMs (Trial)
-
LLMと外部機能、APIやツールを統合するための技術
-
自然言語クエリに基づいて適切な機能を判断し実行
-
OpenAIのGPTシリーズなどで対応
-
RAGやエージェントアーキテクチャの一部として機能
-
思考と行動をブリッジする重要な技術
AIを審査員に - 応答の質を評価する - LLM as a judge (Trial)
-
LLMを使用して他のシステムの応答を評価する手法
-
特に検索結果の関連性やチャットボットの応答の適切性を評価
-
評価システムの慎重な設定とキャリブレーションが必要
-
コスト効率の向上に貢献
-
現在も研究が進行中の分野
新しいパスワードの代替 - より安全な認証 - Passkeys (Trial)
-
パスワードに代わる新しい認証方式
-
Apple、Google、Microsoftが推進
-
非対称暗号を使用し、プライベートキーはユーザーのデバイスに保存
-
生体認証やPINで保護
-
クロスプラットフォーム対応が可能
小さくても頼れる言語モデル - Small language models (Trial)
-
大規模言語モデル(LLM)の小規模版
-
通常3.5億~10億パラメータ規模
-
特定のコンテキストでは大規模モデルと同等以上のパフォーマンス
-
エッジデバイスでの実行が可能
-
Google Gemini NanoやMicrosoft Phi-3シリーズなどが代表例
合成データでトレーニングを加速 - Synthetic data for testing and training models (Trial)
-
人工的なデータセットを生成して、モデルのテストやトレーニングに使用
-
特にLLMのファインチューニングやドメイン特化型データが必要な場合に有用
-
プライバシー保護やデータ不足の解決に役立つ
-
BonitoやMicrosoft's AgentInstructなどのツールを活用
-
不均衡データの問題解決にも効果的
古いコードをAIで読み解く - Using GenAI to understand legacy codebases (Trial)
-
生成AIを使用して古いコードベースを理解・分析する手法
-
特にドキュメントが不足や古い場合に効果的
-
RAGアプローチとコードベースの知識グラフを組み合わせて使用
-
メインフレームの現代化プロジェクトなどで成功例あり
-
既存ドキュメントやAI生成ドキュメントで補強可能
チーム全体をサポートするAIアシスタント - AI team assistants (Assess)
-
チーム全体をサポートするAIツール
-
個人の生産性だけでなく、チーム全体の効率を向上
-
UnblockedやAtlassianのRovoなどのプラットフォームが登場
-
チームの知識共有や自動化をサポート
-
Haivenなどのオープンソースツールも登場
少ない例でも最大限の効果 - Dynamic few-shot prompting (Assess)
-
プロンプトに動的に例を含めてLLMの応答を改善する手法
-
文脈に応じて最適な例を選択
-
コンテキストウィンドウの効率的な使用が可能
-
scikit-llmなどのライブラリが実装を提供
-
トークン消費の削減にも貢献
データ製品のためのインターフェース革命 - GraphQL for data products (Assess)
-
データ製品のアウトプットポートとしてGraphQLを使用する手法
-
データの形式や関係性の発見を容易に
-
LLMとの組み合わせで効果的なデータ探索が可能
-
スキーマを利用したLLMプロンプトの改善
-
クライアントツールとの親和性が高い
自律的に動くAIエージェント - LLM-powered autonomous agents (Assess)
-
複数のAIエージェントが協力して複雑なタスクを実行するシステム
-
AutogenやCrewAIなどのフレームワークで実現
-
各エージェントが特定の役割を担当し、相互に会話
-
まだ初期段階で、無限ループなどの課題も存在
-
LangGraphなどで制御を強化可能
次世代のシステム監視 - Observability 2.0 (Assess)
-
従来の監視ツールを統合的なアプローチに進化
-
構造化された高基数イベントデータを単一のデータストアで管理
-
リアルタイムおよびフォレンジック分析をサポート
-
分散システムの詳細な分析が可能
-
ソフトウェア開発ライフサイクルとの統合を強化
デバイス上でのAI推論 - On-device LLM inference (Assess)
-
ブラウザやエッジデバイスでLLMを直接実行する技術
-
プライバシー保護や低レイテンシーを実現
-
インターネット接続なしでも機能
-
MLX、Transformers.js、Chattyなどのツールが登場
-
WebGPUを活用した実装も可能
スキーマに沿ったAIの出力 - Structured output from LLMs (Assess)
-
LLMの出力を定義されたスキーマに制約する手法
-
JSON SchemaやpydanticなどでフォーマットNを指定
-
関数呼び出しやAPI連携に特に有用
-
幻覚の削減にも効果的
-
チャートのレンダリングなど、様々な用途に適用可能
AIコードに対する依存の警鐘 - Complacency with AI-generated code (Hold)
-
AI生成コードへの過度の依存に対する警告
-
コードベースの急速な肥大化の傾向
-
レビュープロセスの質低下のリスク
-
自動化バイアスや埋没コスト効果への注意喚起
-
AIの使用時期や信頼度の適切な判断枠組みが必要
企業全体の統合テスト環境の課題 - Enterprise-wide integration test environments (Hold)
-
企業全体での統合テスト環境の構築に対する警告
-
貴重なリソースとなり、開発のボトルネックとなりがち
-
環境の違いによる誤った安心感を生む危険性
-
代わりに使い捨て可能な環境やスタブの使用を推奨
-
コントラクトテストや本番環境でのテストを推奨
職場でのAI禁止への懸念 - LLM bans (Hold)
-
職場でのLLM使用を全面的に禁止することへの警告
-
禁止は非承認ツールの使用を促進する危険性
-
代わりに承認されたAIツールの提供を推奨
-
データプライバシー、セキュリティ、コンプライアンスの管理が重要
-
組織的な学習機会の損失を避けるべき
ペアプログラミングのAI置換に対する警告 - Replacing pair programming with AI (Hold)
-
AIでペアプログラミングを完全に置き換えることへの警告
-
コーディングアシスタントは個人の生産性向上には有効
-
しかしチームの協働や知識共有の利点は得られない
-
継続的インテグレーションやコード所有権の観点で重要
-
AIはペアプログラミングの補完として使用すべき
Platforms
データガバナンスの統一ソリューション - Databricks Unity Catalog (Trial)
-
データレイクハウスにおけるデータガバナンスソリューション
-
ファイル、テーブル、機械学習モデルなどのアセット管理
-
外部ストアやDatabricks管理下のデータの統合的な管理が可能
-
ガバナンス、メタストア管理、データ発見を一元化
-
自動災害復旧機能の欠如が課題点
マルチモデル対応のオープンプラットフォーム - FastChat (Trial)
-
LLMのトレーニング、提供、評価のためのオープンプラットフォーム
-
OpenAI API形式で複数のモデルをホスト可能
-
コントローラー・ワーカーアーキテクチャを採用
-
vLLM、LiteLLM、MLXなどのワーカータイプをサポート
-
A/Bテストやモデル移行に特に有効
AIエージェントを簡単に構築 - GCP Vertex AI Agent Builder (Trial)
-
自然言語やコードファーストでAIエージェントを作成するプラットフォーム
-
エンタープライズデータと第三者コネクタを統合
-
プロトタイプ作成からデプロイまでをサポート
-
知識ベースや自動化サポートシステムの構築に適している
-
最小限のセットアップでエージェントベースのシステムを構築可能
LLMアプリケーションの監視強化 - Langfuse (Trial)
-
LLMアプリケーションの観察、監視、評価のためのツール
-
トレーシング、分析、評価機能を提供
-
本番環境での使用パターンの理解に役立つ
-
RAGやLLM駆動の自律エージェントとの相性が良い
-
会話トレースの分析による改善が可能
ベクトル検索の高速化 - Qdrant (Trial)
-
Rustで書かれたオープンソースのベクトル類似度検索エンジン
-
様々なテキストやマルチモーダルな密ベクトル埋め込みモデルをサポート
-
エンタープライズ向けのマルチテナント対応
-
製品知識ベース用の分離されたコレクションとして保存可能
-
アクセスポリシーはアプリケーション層で管理
ハイブリッド検索とビッグデータ処理 - Vespa (Trial)
-
オープンソースの検索エンジンとビッグデータ処理プラットフォーム
-
低レイテンシーと高スループットが特徴
-
複数の検索技術を組み合わせたハイブリッド検索が可能
-
メタデータの効率的なフィルタリングとソート
-
多段階ランキングの実装が可能
クラウドで簡単に高度な検索を - Azure AI Search (Assess)
-
クラウドベースの検索サービス(旧Cognitive Search)
-
構造化・非構造化データの両方を処理
-
PDF、DOC、PPTなどの一般的な形式を自動インジェスト
-
Azure OpenAIとの統合が容易
-
RAGセットアップに特に適している
宣言的なデータパイプライン管理 - Databricks Delta Live Tables (Assess)
-
信頼性の高いデータ処理パイプラインを構築するための宣言的フレームワーク
-
データ変換を宣言的アプローチで定義
-
堅牢な監視機能を提供
-
データパイプライン全体をDAGで視覚化
-
Databricksエコシステムと深く統合
コンプライアンス対応のKubernetes - Elastisys Compliant Kubernetes (Assess)
-
規制とコンプライアンス要件を満たすための特殊なKubernetesディストリビューション
-
ヘルスケア、金融、政府機関向けに設計
-
自動化されたセキュリティプロセス
-
マルチクラウドとオンプレミスをサポート
-
ゼロトラストセキュリティアーキテクチャを採用
分散トランザクションの鍵 - FoundationDB (Assess)
-
Appleが開発し、後にオープンソース化された分散キーバリューストア
-
厳密な直列化トランザクションを提供
-
アンバンドルドアーキテクチャにより、クラスターの各部分を独立してスケール可能
-
書き込みホットスポットを回避するスマートなデータ分散
-
マルチリージョンレプリケーションをサポート
サーバーレスの新しいスタンダード - Golem (Assess)
-
耐久性のある分散コンピューティングのための新しいプラットフォーム
-
サーバーレスサーバーのメモリを永続化する明示的なステートマシンアーキテクチャを使用
-
長時間実行のマイクロサービスやAIエージェントのオーケストレーションに適している
-
WebAssemblyコンポーネントを複数の言語で作成可能
-
決定論的な動作と高速な起動時間が特徴
高性能ストリーミングの新しい選択肢 - Iggy (Assess)
-
Rustで書かれた永続的メッセージストリーミングプラットフォーム
-
複数のストリーム、トピック、パーティションをサポート
-
最大一度の配信と、メッセージ有効期限をサポート
-
QUIC、TCP、HTTPプロトコルをサポート
-
今後のクラスタリングとio_uringサポートで、Kafkaの代替となる可能性
IPFSの進化版 - Iroh (Assess)
-
分散ファイルストレージと配信システム
-
IPFSの進化版として設計
-
ブロックサイズの制限がなく、文書の同期メカニズムを提供
-
ブラウザでのWASM対応を予定
-
既存のIPFSシステムより使いやすさを重視
画像とビデオのAI分析プラットフォーム - Large vision model (LVM) platforms (Assess)
-
ビデオストリームや画像の分析、再構築のためのプラットフォーム
-
拡散モデルや従来の畳み込みニューラルネットワークと組み合わせて使用
-
トレーニングデータの収集、セグメンテーション、ラベリングをサポート
-
V7、Nvidia Deepstream SDK、Roboflowなどが代表的
-
視覚的なインターフェースとAPIの両方を提供
脳とVRをつなぐ未来のインターフェース - OpenBCI Galea (Assess)
-
脳-コンピュータインターフェース(BCI)とVRヘッドセットを組み合わせた製品
-
非侵襲的な技術で脳波などの生体信号を取得
-
時間同期された生理学的データストリームを提供
-
空間位置センサーとアイトラッキング機能を統合
-
Unity/Unrealでのデータ活用が可能
ブラウザでPostgreSQLを動かす - PGLite (Assess)
-
PostgreSQLデータベースのWASM(WebAssembly)ビルド
-
ブラウザ内で直接PostgreSQLを実行可能
-
Linux仮想マシンを必要としない直接的なWASMビルド
-
メモリ内の一時データベースまたはindexedDBを使用した永続化が可能
-
ローカルファーストアプリケーションの構築に適している
KubernetesとWebAssemblyの融合 - SpinKube (Assess)
-
Kubernetes上のWebAssemblyのためのオープンソースサーバーレスランタイム
-
コンテナの起動時間の課題を解決
-
ミリ秒単位での起動時間を実現
-
オンデマンドワークロードに柔軟に対応
-
Kubernetesでのwebassemblyワークロードの開発とデプロイを簡素化
SDLCを支援する開発資産発見ツール - Unblocked (Assess)
-
ソフトウェア開発ライフサイクル(SDLC)のアセットと成果物の発見をサポート
-
一般的なアプリケーションライフサイクル管理(ALM)ツールと統合
-
コードベースの理解を即座のコンテキスト提供で改善
-
チームの知識共有を促進
-
エンジニアリングチームが関連リソースに安全にアクセス可能
Tools
シンプルに強力なAPIテストツール - Bruno (Adopt)
-
PostmanやInsomniaに代わるAPIテスト・開発・デバッグ用のオープンソースデスクトップツール
-
オフラインでの使用を前提とした設計で、優れたセキュリティとプライバシーを提供
-
コレクションはBru Langという独自のマークアップ言語で保存
-
Gitなどのバージョン管理ツールと統合可能
-
VS Code拡張機能も提供され、他のIDE対応も予定
Kubernetes管理を楽にする視覚ツール - K9s (Adopt)
-
Kubernetesクラスタの管理・可視化ツール
-
より詳細なグラフとビューを提供する機能が追加
-
ログとメトリクスの改善された表示機能
-
カスタムリソース(CRD)のより柔軟な表示と管理
-
デバッグツールとの統合が強化
安全にファイルを管理する暗号化ツール - SOPS (Adopt)
-
暗号化されたファイルを編集するためのツール
-
クラウドのKMS(Key Management Service)と統合
-
インフラストラクチャのブートストラップ認証情報の管理に有用
-
AWS、GCP、Azure Key Vaultなどと連携
-
クロスプラットフォームで動作し、PGPキーもサポート
視覚の違いを検出する回帰テスト - Visual regression testing tools (Adopt)
-
視覚的な回帰テストを行うためのツール群
-
単純なピクセル比較から、パターンマッチングやOCRまで進化
-
BackstopJSなどのツールで特定の要素に焦点を当てたテストが可能
-
AIと機械学習を活用した比較機能を提供
-
ApplitoosやPercyなどの商用ツールが人気
クラウドセキュリティの可視化と保護 - Wiz (Adopt)
-
クラウドセキュリティプラットフォーム
-
リスクと脅威をより早期に検出可能
-
設定ミス、脆弱性、漏洩した秘密情報を継続的にスキャン
-
デプロイ前のアーティファクトと本番環境の両方を監視
-
開発チームとリーダーシップ向けの強力なレポート機能を提供
AWSアカウント管理を簡素化 - AWS Control Tower (Trial)
-
マルチチーム環境でのAWSアカウント管理ツール
-
セキュリティとコンプライアンスコントロールを自動的に適用
-
新しいランディングゾーンに自動的にコントロールを適用
-
Terraform用のAccount Factory(AFT)をサポート
-
GitHub Actionsなどの外部ツールとの安全な統合が可能
CIの状態をMacで簡単監視 - CCMenu (Trial)
-
継続的インテグレーション(CI)システムの状態を監視するMacアプリ
-
リモートワーク環境下でのCI状態確認に最適
-
cctrayフォーマットをサポートするすべてのCIサーバーと連携可能
-
Jenkins、TeamCity、GitHub Actionsをサポート
-
Thoughtworkerによって開発された軽量なツール
高速でリアルタイムなデータ分析 - ClickHouse (Trial)
-
リアルタイム分析用のオープンソースカラムナーOLAPデータベース
-
事前集計なしでインタラクティブなクエリを実行可能
-
高性能なクエリ処理エンジンとデータ圧縮を特徴とする
-
OpenTelemetryデータの保存に適している
-
Jaegerと統合してトレースデータの分析が可能
一貫した開発環境を保つコマンドラインツール - Devbox (Trial)
-
一貫した開発環境を維持するためのコマンドラインツール
-
Nixパッケージマネージャーを利用しつつ、VMやコンテナを必要としない
-
プロジェクトごとの開発環境を再現可能な形で作成
-
シェルフック、カスタムスクリプトをサポート
-
VSCodeのdevcontainer.json生成に対応
コード差分を構文レベルでハイライト - Difftastic (Trial)
-
コードファイル間の違いを構文を考慮して表示するツール
-
従来のテキストベースの差分ツールとは異なるアプローチ
-
プログラムの構文に影響を与える変更のみをハイライト
-
抽象構文木(AST)を使用して差分を計算
-
50以上のプログラミング言語をサポート
チームのエンジニアリングインテリジェンス - LinearB (Trial)
-
ソフトウェアエンジニアリングインテリジェンスプラットフォーム
-
ベンチマーク、ワークフロー自動化、開発者体験の改善に注力
-
エンジニアリングチームのメトリクスを追跡し、改善点を特定
-
DORAメトリクスの測定と追跡を自動化
-
データ駆動の意思決定をサポート
PostgreSQLにベクトル検索の力を - pgvector (Trial)
-
PostgreSQL用のオープンソースのベクトル類似度検索拡張
-
構造化データと一緒にベクトルを保存可能
-
ACIDコンプライアンスやポイントインタイムリカバリなどの機能を継承
-
生成AI駆動アプリケーションでの利用が増加
-
専用のベクトルストアが不要なケースで特に有用
クロスプラットフォームで自己完結型のアプリを構築 - Snapcraft build tool (Trial)
-
Ubuntu、Linux、macOS向けの自己完結型アプリケーションビルドツール
-
複数のハードウェアプラットフォームに簡単にデプロイ可能
-
パブリックとプライベートの両方のアプリストアをサポート
-
車載コンピュータシステムなどの組み込みソフトウェア開発に適している
-
内部アーティファクトリポジトリへの公開が可能
継続的デリバリーを支えるオープンプラットフォーム - Spinnaker (Trial)
-
Netflixが作成したオープンソースの継続的デリバリープラットフォーム
-
クラスター管理と事前にビルドしたイメージのクラウドへのデプロイを重視
-
マイクロサービスのデプロイに関する独自の考え方を提供
-
spin CLIでパイプラインのコード化が可能に
-
複雑なデプロイパイプラインに特に適している
OpenAPI仕様をTypeScriptから生成 - TypeScript OpenAPI (Trial)
-
コードからOpenAPI仕様を生成するSwaggerの代替ツール
-
TypeScriptコントローラーとモデルをソースとして使用
-
TypeScriptのアノテーションやデコレータを活用
-
OpenAPI 2.0と3.0の両方の仕様を生成可能
-
Express、Hapi、Koaのルート生成をサポート
機能トグルでフレキシブルにリリース管理 - Unleash (Trial)
-
機能トグル管理のためのツール
-
シンプルな機能トグルから段階的ロールアウトまでサポート
-
複数の言語用SDKを提供し、開発者体験が優れている
-
サービスとしても自己ホスト型としても利用可能
-
スケーラブルな機能管理を実現
Airflowとdbtの統合でデータパイプラインを強化 - Astronomer Cosmos (Assess)
-
Airflowプラグインでdbtコアワークフローをネイティブにサポート
-
dbtノードをAirflowタスク/タスクグループに変換
-
Airflow UIでdbt依存関係グラフと実行進捗を可視化
-
Airflow接続を使用してdbtプロファイルの設定を簡素化
-
Airflowでのdbt作業をよりシームレスに
PDFからデータを引き出すビジョン言語モデル - ColPali (Assess)
-
ビジョン言語モデルを使用したPDFドキュメント検索ツール
-
画像、図表、テーブルを含むマルチメディアドキュメントからのデータ抽出
-
ページ全体を処理し、テキストと視覚的な内容を考慮した埋め込みを作成
-
RAGアプリケーションのパフォーマンスを大幅に向上
-
まだ初期段階だが有望な技術
AIファーストのコードエディタ - Cursor (Assess)
-
AIファーストのコードエディタ
-
既存のコードベースに基づく強力な文脈理解能力
-
マルチラインおよびマルチファイル編集操作が特徴
-
VSCodeをベースに開発され、直感的な操作を提供
-
ctrl/cmd+KとLによる強力な操作が可能
データメッシュの管理をメタデータレイヤーで支援 - Data Mesh Manager (Assess)
-
データメッシュプラットフォームのメタデータレイヤーを提供
-
データプロダクトの定義とデータ契約の仕様化に焦点
-
OpenContract イニシアチブを使用
-
データカタログ機能でデータプロダクトとメタデータの発見をサポート
-
分散型ガバナンスを可能に
Gitブランチ管理をグラフィカルに簡略化 - GitButler (Assess)
-
Gitのブランチと変更管理のためのグラフィカルインターフェース
-
未コミットの変更を独立して追跡し、仮想ブランチに整理
-
GitHubと統合してPRの作成と管理が可能
-
複数ブランチの同時作業を簡素化
-
PRプロセスの複雑さに対処
コーディングをサポートするJetBrainsのAI - JetBrains AI Assistant (Assess)
-
全てのJetBrains IDEと統合されたコーディング支援ツール
-
OpenAIやGoogle Geminiなどのモデルを活用
-
コーディングスタイルを記憶し、一貫した出力を保証
-
テスト生成機能が特に有用
-
独自モデルをホストしないため、データ処理に注意が必要
バージョン管理を一元化する高速ツール - Mise (Assess)
-
複数の言語とツールのバージョン管理を単一のツールで実現
-
nvm, pyenv, rbenv, rustupなどの代替として機能
-
Rustで書かれており、高速なシェル対話を実現
-
PATHを事前に修正し、直接ツールを呼び出し
-
タスクランナー機能も統合
APIを手軽にモックするオープンソースツール - Mockoon (Assess)
-
オープンソースのAPIモックツール
-
直感的なインターフェースとカスタマイズ可能なルート
-
動的レスポンスの生成が可能
-
OpenAPIと互換性があり、モックデータセットの自動生成をサポート
-
部分的なモックで特定のAPIルートのみシミュレート可能
macOS向け効率化ランチャー - Raycast (Assess)
-
macOS向けのfreemiumランチャー
-
アプリケーション起動、コマンド実行、ファイル検索を効率化
-
開発者向けの機能が充実
-
VSCode、Slack、Jira、Googleなどのサードパーティアプリと統合
-
Pro版ではAI搭載の検索アシスタントを提供
クエリキャッシュでデータベースパフォーマンスを向上 - ReadySet (Assess)
-
MySQLとPostgreSQLのためのクエリキャッシュ
-
データベースレプリケーションストリームを活用して増分更新
-
部分的なビューの具現化により、従来のリードレプリカより低いレイテンシーを実現
-
既存のデータベースの前段に配置可能
-
アプリケーションの変更なしで読み取りワークロードをスケール可能
高速バンドリングを実現する新ツール - Rspack (Assess)
-
WebpackやViteに代わる新しいバンドリングツール
-
Webpackとの互換性を保ちながら、より高速なパフォーマンスを実現
-
Rustで書かれており、開発者体験を重視
-
既存のWebpackプラグインやローダーと互換性あり
-
複雑なWebpackセットアップからの移行に適している
ユーザー意図を理解してフローにルーティング - Semantic Router (Assess)
-
LLMベースのアプリケーションでユーザーの意図を判断し、適切なエージェントやフローにルーティング
-
ベクトル埋め込みを使用して意図を推論
-
不要なLLMコールを削減し、コスト効率を向上
-
リアルタイムの意思決定に適している
-
様々なセマンティックタスクに応用可能
プルリク作成を自動化するエージェント - Software engineering agents (Assess)
-
コード変更の提案やプルリクエストの作成を自動化
-
GitHub IssueやJiraチケットから計画を立案
-
特定の範囲の単純なタスクに効果的
-
GitHub Copilot Workspace、qodo flow、TabnineのJIRAエージェントなどが登場
-
複雑な問題への対応はまだ発展途上
Pythonパッケージ管理を高速化 - uv (Assess)
-
Rustで書かれたPythonパッケージ管理ツール
-
高速なパフォーマンスが特徴
-
他のPythonパッケージ管理ツールと比べて大幅に高速
-
開発者体験の向上に貢献
-
Python環境管理の簡素化を実現
新しい体験を提供するターミナル - Warp (Assess)
-
macOSとLinux向けの新しいターミナル
-
コマンド出力をブロックに分割して可読性を向上
-
AI駆動の機能でコマンド提案をサポート
-
ノートブック機能でコマンドと出力を整理可能
-
Starshipと統合してカスタマイズ可能
高パフォーマンスなRust製テキストエディタ - Zed (Assess)
-
Atomエディタの開発者による新しいテキストエディタ
-
Rustで書かれ、現代的なハードウェアを最大限活用
-
多くのプログラミング言語をサポート
-
複数のLLMプロバイダとの統合によるAIコーディング支援
-
リアルタイムのリモートコラボレーション機能を搭載
長年使われたが今はメンテナンスモード - CocoaPods (Hold)
-
SwiftとObjective-Cのための依存関係管理ツール
-
10年以上の歴史を持つが、現在はメンテナンスモードに
-
アクティブな開発は終了
-
Swift Package Managerへの移行を推奨
-
リソースは利用可能だが、新規開発は非推奨
Languages and Frameworks
データ変換を自在に操る - dbt (Adopt)
-
ELTパイプラインでのデータ変換実装のための強力なツール
-
エンジニアリングの厳密さを重視し、モジュール性、テスト可能性、再利用性を実現
-
多くのクラウドデータウェアハウスやレイクハウスと統合
-
コミュニティパッケージの健全なエコシステム
-
ユニットテストのネイティブサポートを強化
環境構築をシンプルに - Testcontainers (Adopt)
-
テスト環境構築のための信頼性の高いライブラリ
-
データベース、キューイング技術、クラウドサービス、UIテスト依存関係をDockerで提供
-
複数の言語に移植され、カスタムDockerfileもサポート
-
デスクトップ版でテストセッションの視覚的管理が可能
-
複雑なシナリオの管理をサポート
分散メッセージングを安心して - CAP (Trial)
-
.NETライブラリでOutboxパターンを実装
-
RabbitMQやKafkaなどの分散メッセージングシステムでの原子性を保証
-
データベース更新とイベント発行を同一トランザクションで管理
-
複数のデータベースとメッセージングプラットフォームをサポート
-
少なくとも1回の配信を保証
自動運転研究の仮想舞台 - CARLA (Trial)
-
自動運転研究のためのオープンソースシミュレータ
-
車両、地形、人間、動物などの3Dモデルを柔軟に作成・再利用可能
-
歩行者や対向車など、動的なシナリオのシミュレーションが可能
-
自動運転システムのテストと開発に利用
-
本番デプロイ前のテストに特に有効
データパイプラインを効率化 - Databricks Asset Bundles (Trial)
-
Databricksアセットのパッケージングとデプロイを効率化
-
ワークフローとタスクの設定、実行コードをバンドルとして管理
-
CI/CDパイプラインを通じた複数環境へのデプロイをサポート
-
一般的なアセットタイプのテンプレートを提供
-
カスタムテンプレートによる拡張が可能
出力を思い通りに - Instructor (Trial)
-
LLMから構造化された出力を得るためのライブラリ
-
JSON、YAML等の形式で定義された構造での出力を要求
-
LLMが要求された構造を返さない場合のリトライ機能
-
ストリーミング結果からの部分構造の解析をサポート
-
様々なLLMと互換性あり
MLOpsにモジュール性を - Kedro (Trial)
-
MLOpsツールとしての機能を大幅に改善
-
モジュール性とエンジニアリングプラクティスに重点
-
kedro-datasetsパッケージでコードとデータを分離
-
CLI、スタータープロジェクトテンプレート、テレメトリ機能を強化
-
VS Code拡張機能で開発者体験を向上
LLMを統一的に扱う - LiteLLM (Trial)
-
様々なLLMプロバイダーのAPIを統一的に扱うライブラリ
-
OpenAI API形式で標準化されたインターフェースを提供
-
完了、埋め込み、画像生成をサポート
-
キャッシング、ロギング、レート制限、負荷分散などの運用機能
-
異なるモデル間の切り替えを容易に
コンテキスト拡張の鍵 - LlamaIndex (Trial)
-
ドメイン特化型のコンテキスト拡張LLMアプリケーション構築を可能に
-
データの取り込み、ベクトルインデックス作成、質問応答をサポート
-
RAGパイプラインの構築を効率化
-
LlamaHubでモジュールの拡張やカスタマイズが可能
-
様々なLLM、埋め込み、ベクトルストアプロバイダーと連携
安全で正確なAI出力を守る - LLM Guardrails (Trial)
-
LLMの出力を制御するためのガイドラインと制約
-
有害、誤解を招く、または無関係なコンテンツの生成を防止
-
入力操作などの悪用からシステムを保護
-
NeMo Guardrails、Guardrails AI、Aporia Guardrailsなどのフレームワークを提供
-
継続的な改善が重要
カスタマイズ可能なeコマース - Medusa (Trial)
-
カスタマイズ可能なオープンソースeコマースプラットフォーム
-
Next.jsとPostgreSQLをベースに構築
-
ショッピングカート、注文管理から高度な機能まで提供
-
地域ごとの税計算やギフトカードなどのモジュールを包括的にサポート
-
独自のショッピング体験の構築に適している
シンプルな設定管理 - Pkl (Trial)
-
Appleが内部で使用していた設定言語とツールのオープンソース版
-
型とバリデーションシステムが特徴
-
環境オーバーライドなどのコード重複を削減
-
デプロイ前の設定エラーを検出
-
JSON、PLIST、YAML、.propertiesファイルの生成をサポート
ロボット開発の新基準 - ROS 2 (Trial)
-
ロボットシステム開発のためのオープンソースフレームワーク
-
プロセス間通信、マルチスレッド実行、サービス品質をサポート
-
前バージョンからリアルタイム性能を改善
-
モジュール性とプラットフォームサポートを強化
-
自動車産業での採用が増加
高保証なOSマイクロカーネル - seL4 (Trial)
-
高保証、高性能なオペレーティングシステムマイクロカーネル
-
形式検証手法で動作の正確性を数学的に保証
-
マイクロカーネルアーキテクチャでシステムの安定性を確保
-
EVメーカーなどでの採用が進む
-
安全性が重要なシステムに適している
効果的な意図分類 - SetFit (Trial)
-
文章トランスフォーマーの微調整フレームワーク
-
対照学習で異なる意図クラスを分離
-
少数の例でも効果的な分類が可能
-
チャットボットの意図検出などに有効
-
OpenAIのモデレーションAPIの代替として使用可能
高効率なLLM推論 - vLLM (Trial)
-
高スループット、メモリ効率の良いLLM推論エンジン
-
クラウドまたはオンプレミスで実行可能
-
複数のモデルアーキテクチャをサポート
-
OpenAI SDKと互換性のある一貫したモデル提供
-
Azureのデフォルト推論エンジンとして採用
オープンテーブル相互運用性 - Apache XTable™ (Assess)
-
オープンテーブルフォーマット間の相互運用性を実現
-
Hudi、Delta、Icebergの間でのメタデータ変換
-
基礎データのコピーなしで変換が可能
-
複数のテーブルフォーマットの実験に有用
-
機能の「最小公倍数」に制限される可能性あり
大量のテストデータ生成 - dbldatagen (Assess)
-
Databricks環境でのテストデータ生成用Pythonライブラリ
-
数分で数十億行のデータを生成可能
-
複数テーブル、変更データキャプチャ、結合操作をサポート
-
Spark SQLのプリミティブ型に対応
-
さまざまな分布でのデータ生成が可能
AI性能の評価を簡単に - DeepEval (Assess)
-
LLMパフォーマンス評価のためのオープンソースフレームワーク
-
RAGアプリケーションやLangChain/LlamaIndexで構築されたアプリを評価
-
幻覚検出、回答の関連性、ハイパーパラメータ最適化をサポート
-
pytestと統合可能
-
CI/CDパイプラインへの組み込みが容易
新しいLLMアプローチ - DSPy (Assess)
-
LLMアプリケーション開発のための新しいアプローチを提供
-
直接的なプロンプトエンジニアリングを避け、より高レベルな抽象化を導入
-
プログラムフロー、最適化メトリクス、トレーニングデータに基づく設計
-
PyTorchに似たコーディングスタイル
-
従来とは異なる革新的なアプローチを提供
クロスプラットフォームの拡張 - Flutter for Web (Assess)
-
iOS、Android、ウェブブラウザ向けのクロスプラットフォーム開発を実現
-
WebAssemblyのサポートが安定版に
-
JavaScriptターゲットより優れたパフォーマンスを実現
-
プログレッシブウェブアプリ、シングルページアプリに適している
-
既存のFlutterモバイルアプリのウェブ移植に効果的
ドキュメントQ&Aを簡単に - kotaemon (Assess)
-
RAGベースのドキュメントQ&Aアプリケーション構築ツール
-
PDF、DOCなど複数のドキュメント形式に対応
-
GradioベースのウェブUIを提供
-
ベクトルストアとRAGパイプラインを内蔵
-
ソース文書の引用と関連性スコアを提供
スムースなスクロールを実現 - Lenis (Assess)
-
モダンブラウザ向けの軽量なスムーススクロールライブラリ
-
WebGLスクロール同期やパララックス効果を実現
-
流動的なスクロールインタラクションの構築に最適
-
実装がシンプルで使いやすい
-
アクセシビリティへの配慮が必要
プロンプトの効率化 - LLMLingua (Assess)
-
小規模言語モデルを使用してプロンプトを圧縮
-
性能を維持しながら不要なトークンを削除
-
推論のコスト効率、レイテンシー、コンテキスト処理を改善
-
追加トレーニングなしで様々なLLMと互換
-
LlamaIndexなどのフレームワークをサポート
AIエージェントの簡単構築 - Microsoft Autogen (Assess)
-
AIエージェントの作成とオーケストレーションを簡素化
-
マルチエージェントの協調を実現
-
自律的および人間介在型のワークフローをサポート
-
様々なLLMとの互換性
-
スケーラビリティに関する懸念あり
新しいネットワーク基盤 - Pingora (Assess)
-
高速で信頼性の高いネットワークサービス構築用Rustフレームワーク
-
Cloudflareが開発し、Nginxの制限を解決
-
柔軟なアプリケーション層ルーティングを提供
-
セキュリティとパフォーマンスを両立
-
Riverなどの新しいプロキシの基盤として採用
RAGパイプラインの性能評価 - Ragas (Assess)
-
RAGパイプラインの性能評価フレームワーク
-
忠実性、回答の関連性、コンテキスト利用などのメトリクスを提供
-
パラメータの微調整やモデル変更の評価に有用
-
日次評価パイプラインに組み込み可能
-
複雑なRAGパイプラインの評価には制限あり
コンテナデプロイの新標準 - Score (Assess)
-
コンテナワークロードのデプロイ要件を記述する宣言的言語
-
組織の標準を強制するためのプラットフォームオーケストレーション
-
Humanitecが開発し、現在はCNCFのオープンソースプロジェクト
-
KubernetesとDocker Composeのリファレンス実装を提供
-
内部開発プラットフォーム向けの標準化に貢献
再利用可能なUIコンポーネント - shadcn (Assess)
-
再利用可能なコピー&ペーストコンポーネントを提供
-
Radix UIとTailwind CSSで構築
-
完全な制御とカスタマイズが可能
-
CLIでコンポーネントの取り込みを支援
-
依存関係の削減と柔軟な実装を実現
組み込み向け軽量GUI - Slint (Assess)
-
Rust、C++、JavaScript向けの宣言的GUIフレームワーク
-
組み込みシステムのUI開発に特に有用
-
HTMLライクなマークアップ言語を使用
-
ライブプレビューとレスポンシブUIデザインをサポート
-
リソース使用量が少なく、組み込みシステムに適している
クラウドアプリのデプロイを簡単に - SST (Assess)
-
クラウドアプリケーションのデプロイと必要なサービスのプロビジョニングを行うフレームワーク
-
TypeScript APIでアプリケーション環境を定義
-
Git pushでのデプロイをトリガー
-
GUIコンソールで管理機能を提供
-
TerraformとPulumiをベースに実装され、クラウド非依存
Sonnet 3.5 New による総括
-
全体的にAI/LLM関連の技術が多く登場
-
Rustで実装されたツールやフレームワークが増加
-
WebAssembly (WASM) 関連の技術が成熟
-
セキュリティとコンプライアンスに関する項目が充実
-
クラウドネイティブな開発環境の整備が進展
個人的な所感
やはり生成 AI 関連のプロダクト・ツールが多い。
基本的には X で技術関連のトピックを拾いつつ、OSS Insight や GitHub Trends, Product Hunt なんかを覗きながらキャッチアップめいたことを行っているが、Technology Radar で取り上げられるそれぞれは大抵が初見のものばかりで驚く。
(とはいえ、全部が全部すぐさま使い始めるものではないのだが。というより、ほぼほぼ使い始められないのだが)
Discussion