【速報】AWS re:Invent 2024新機能・新サービスまとめ
はじめに
三菱UFJインフォメーションテクノロジーの鈴木です。
ラスベガスで開催中のAWS re:Invent 2024にて、2024年12月3日のKeynoteで発表された新機能・新サービスをまとめます。
先にまとめ
新機能・新サービスは、やはり生成AIを中心に据えたラインナップとなりました。
あえて整理すると次の3つの軸になりそうです。
- 生成AIのモデル開発自体の高速化
- 生成AIを組み込んだアプリ開発・運用の高度化・高速化
- 開発現場のモダナイゼーションやビジネス現場のユーザ体験を生成AIで促進・変革
つまり、生成AIの開発から活用までEnd-to-Endです。
特にBedrock関連の機能強化は、AWSでの生成AI運用を一段上のステージに引き上げるものと言えるため今後が非常に楽しみな内容です。
AI/ML関連は翌12月4日のKeynoteで別途詳細発表が予定されており、そちらも要注目です。
一方で、Keynote中ではセキュリティの重要性が再三にわたって言及されていました。
その意味では、セキュリティ関連機能の大きな新発表こそなかったものの、AWSとしては引き続きセキュリティを最優先していく、というトップメッセージが強く発信されたKeynoteでした。
新発表一覧
Compute
生成AIのモデル学習に特化してインスタンスとチップを強化。
他クラウドに比べてもリッチなコンピュートリソースとのこと。
Amazon EC2 P6 instances
- NVIDIA Blackwell GPU-based instances
Amazon EC2 Trn2 instances
- 現世代のGPUベースのインスタンスよりも費用対効果が30-40%改善
- 16 Trainium2 chips
- Up to 20.8 FP8 petaflops
Amazon EC2 Trn2 UltraServers
- 4 Trn2 inctances connected with NeuronLink
- 64 Trainium2 chips
- Up to 83.2 FP8 petaflops
AWS Trainium3
- 3NM process node
- 40% more energy efficiency
- 2X performance
Storage
保管しているデータを使う時のパフォーマンスが向上。
本Keynote中で、S3 TablesはDataLakeパフォーマンスのゲームチェンジャーになると信じている、と言及あり。
サラッと軽く発表されていたが、よく考えるとこれはDataLake -> DataWarehouse -> BI/AIという考え方の転換点になるのかもしれない。
実際、AWSで何らかのワークロードを運用しようとしたらS3は必ず利用することになるため、S3でこれだけのテーブルデータ処理ができれば中途半端なDataWarehouseはいらないじゃん、という話になる。
スケジュール実行でデータ処理したいならAWS Glueのジョブを設定したり、Amazon Athenaなどを実行するLambda関数をEventBridgeでトリガーしたりすれば良い訳で、その際の入力は全てS3 Tablesになる。
処理済みのデータは再びS3に戻してあげれば、今どきS3コネクタを持っていないBI/AIツールなど存在しないので、S3から直接データ活用の出口に繋がる。
個人的にはGoogleのGCSが次回どんな発表をしてくるかに注目したい。
Amazon S3 Tables
- Apache Iceberg tablesに対して、通常の3倍高速なクエリパフォーマンスと10倍高速なトランザクションを実現
Amazon S3 Metadata
- S3オブジェクトのメタデータを自動更新
Databases
マルチリージョンでリアルタイムにミリ秒以下のタイムスタンプも同期したり、超低レイテンシを実現したりすることで、世界中での分散が可能。
Amazon Aurora DSQL
- Distributed SQL database
- 実質的に究極のスケーラビリティ
- ゼロインフラストラクチャ管理
- 99.999%のマルチリージョン可用性
- 強い一貫性
- PostgreSQL互換
Amazon DynamoDB global tables
- マルチリージョンで強い一貫性を提供
Inference
Compute -> Storage -> Databaseと話題が進んで、次に出てきたのがNetworkやSecurityではなくInferenceという辺り、これまでの話題は全てここに繋がる布石だったと理解。
Bedrockの機能強化。
multi-agent collaborationはようやくと言うか満を持してと言うかの登場。引き続き今後に期待。
Amazon Bedrock Model Distillation
- Amazon Nova、Claude、Llama3で蒸留モデルを作成可能
- 蒸留により最大500%高速化、75%コスト削減
- 公式ブログ
Amazon Bedrock Automated Reasoning checks
- 数学的証明を用いてモデルの応答の正確性を検証
- 事実誤認修正のためのレコメンド提供
- EXPOブースでデモを見る限り、自前の規約などドキュメントをアップロードすることでルールを自動生成し、Guardrailsのコンテンツフィルターやワードフィルターとして使用可能にするもの。
どの辺りが数学的証明なのかはまだよく分からない。 - AWSブログによると、アップロードしたドキュメントから演繹をしてモデルの応答を検証しているらしい。この論理演算を指して数学的証明という言葉を使っている様子
Amazon Bedrock multi-agent collaboration
- ノーコードでエージェントのオーケストレーション可能
- 複数エージェント並列動作でタスクを高速化
- オーケストレーションを制御するSuperviser Agentsと、その配下で個々のタスクを処理するSub Agentsを定義する
- Superviser Agentsは階層構造を持たせて複数定義可能
- 最終のアウトプットをSuperviser Agentsが取りまとめて出力するか、個々のSub Agentsが出力するかは柔軟に設定可能
- EXPOブースでデモを見る限り、Superviser Agents定義時にinstractionsとして渡したプロンプトの範囲内では、Superviser AgentsがSub Agentsの出力を見てその場で柔軟にネクストアクションを采配してくれるものの、限界がある様子。今後どこまでフルマネージドで可能になるか期待。
独自基盤モデル
このタイミングで独自基盤モデルを提供開始する理由は、ユーザに選択肢を提供するため、とのこと。
とは言え、NovaとClaudeを使い分ける判断基準はまだよく分からない。
Amazon Nova
- 性能の異なるMicro、Lite、Pro、Premierの4種類のモデル
- 75%のコスト削減
- Bedrock提供モデルで最速
- ファインチューニング可能
- 蒸留可能
- Bedrock Knowledge baseと統合
- API利用するエージェントアプリケーションに最適化
- KeynoteではSoTAを謳い、ベンチマークも公表されたが、実際どこまでできるかは要検証
Amazon Nova Canvas
- 自然言語のプロンプトで画像生成
- 画像入力により配色やレイアウトを編集可能
- 安全で責任あるAIとしてビルトインコントロール
- トレーサビリティのための透かし
- 有害コンテンツ生成を制限するためのコンテンツモデレーション
Amazon Nova Reel
- SoTAの動画生成モデル
- パンモーション、360度回転、ズームなどのカメラコントロールを提供
- 安全で責任あるAIとしてビルトインコントロール
- トレーサビリティのための透かし
- 有害コンテンツ生成を制限するためのコンテンツモデレーション
- 現在6秒の動画をサポート、近日中に2分をサポート予定
Amazon Novaの今後のロードマップ
- Amazon Nova Speech-to-Speech
- 音声入力に対して音声出力を実現
- Amazon Nova Any-to-Any
- 任意の入力に対して任意の出力を実現
Amazon SageMaker AI / Amazon SageMaker Platform
SageMakerを改めてデータ分析とAIモデル開発の中心に置いて各サービスを統合するというもの。
SageMaker Lakehouseで何がどこまでできるかは今日のKeynoteでは未知数。元祖LakehouseのDatabricksに対して概念を追従しているだけなのか、独自ポイントを出してきているのか、EXPOブースのAWSスタッフに聞いても詳細は明日のKeynoteを聞いてくれとのこと。
RedshiftやAWS Glueなど既存のデータ分析サービスに散財しているデータを一元的にアクセスできるガワを作ったのがSageMaker Lakehouseという印象。
Amazon SageMaker Unified Studio
- 以下をStudioのUIに統合
- RedshiftでのSQL分析
- EMR、Glue、Athenaでのデータ処理
- SageMakerでの機械学習
- Bedrockでの生成AI開発
- MSK、Kinesisでのストリーミングデータ処理
- QuickSightのBI
- OpenSearchでの検索
Amazon SageMaker Lakehouse
- S3、Redshift、SaaSその他フェデレーションされたデータソースに一元的にアクセス可能
- データガバナンスのための一貫したきめ細かなアクセス制御
- Apache Iceberg互換
開発者体験の改善
果たしてどこまでできるかは今日のKeynoteでは未知数。Github Copilotとの比較が気になる。
- Amazon Q generates and applies unit tests
- Amazon Q generates accurate documentation
- Amazon Q performs code reviews
- GitLab Duo with Amazon Q
モダナイゼーション
WindowsアプリケーションとVMwareのワークロードとメインフレームのモダナイゼーションを生成AIの力で強力推進!とは言うものの、所謂日系大手企業では検証するだけでも一苦労しそう。
Amazon Q Developer Transform .Net applications from Windows to Linux in a fraction of the time
- .NETアプリケーションをWindowsからLinuxへ最大4倍の速さでモダナイズ
- エージェントが数百のアプリケーションを並行して変換
- コストを最大40%削減
Amazon Q Developer Transform VMware workloads to cloud native architectures
- ネットワーク構成の計画、依存関係の特定、変換をエージェントが自律実行
Amazon Q Developer Transform maiunframe applications to accelerate migrations
Amazon Q Developer Investigate issues across your AWS environment in afraction of the time
Amazon Q Businessの強化
Q Businessが色々便利になるらしいが、実際どこまでユーザ体験を変革できるのか詳細は今日のKeynoteでは未知数。
Combining QuickSight and Amazon Q Business data (and vice vasa)
ISVs can now integrate with the Amazon Q index
- 複数アプリケーションのデータにアクセス可能
- データへのアクセス許可を完全制御
- 単一のインデックスでセキュリティ強化
Amazon Q Business can automate complex workflow
- ドキュメントからワークフローを自動構築
- ワークフローの変更をリアルタイムでナビゲート
Discussion