👻

週刊AWSキャッチアップ(週刊AWS/週刊生成AI 2025/8/11週)

に公開

週刊AWS – 2025/8/11週 | Amazon Web Services ブログ

週刊生成AI with AWS – 2025/8/11週 | Amazon Web Services ブログ

AWS IoT Core が DeleteConnection API を導入し MQTT 接続を効率化

  • AWS IoT CoreにてDeleteConnection APIが新規追加されました
    • Client IDを指定してMQTTデバイスを切断できるほか、オプションで永続化されたセッション情報のクリア、LWT(Last Will and Testament)メッセージの抑制などもできます
    • ドキュメントに記載されているユースケース:
      • 過剰にリソースを消費/誤動作を起こしているクライアントの切断
      • クライアントを別のエンドポイントやリージョンに再接続する必要がある場合

参考リンク

MQTT - AWS IoT コア

[アップデート]AWS IoT Coreにデバイスとの接続を切断できるDeleteConnection APIが追加されました | DevelopersIO

Amazon RDS for Oracle が 2025 年 7 月 Spatial Patch Bundle をサポート開始

Amazon SageMaker HyperPod が新しいクラスター設定エクスペリエンスを提供開始

  • SageMaker HyperPodにて新しいクラスター作成体験が提供開始されました
    • 従来はネットワーク、IAMロール、ストレージ、コンピューティングを手動で作成する必要がありましたが、これらを数回クリックするだけで作成できるようになっています。
  • SageMaker HyperPodは大規模言語モデルの推論や分散並列学習を行う基盤を提供するサービスです

image-20250822180015065

image-20250822180035344

image-20250822180050937

クラスター配置グループにおける EC2 オンデマンドキャパシティ予約の新しい共有とターゲティング機能

  • Cluster Placement Groupsのオンデマンドキャパシティ予約(CPG-ODCR)にて、複数のプレイスメントグループにて一括で管理できるようになりました
  • またAWS Resource Access Managerを介して複数のAWSアカウント間で、CPG-ODCRを共有できるようになりました
    • これまでは単一のプレイスメントグループ内でしかオンデマンド予約の容量を使用できなかった

参考リンク

Use Capacity Reservations with cluster placement groups - Amazon Elastic Compute Cloud

AWS IAM Identity Center が Amazon SageMaker Studio でのユーザーバックグラウンドセッションのサポートを導入

  • AWS IAM Identity CenterにてAmazon SageMaker Studioのユーザーバックグラウンドセッションをサポートしました
    • AWS IAM Identity Centerの機能であるTrusted Identity Propagation (TIP)を使用して、AWSサービス間でユーザーIDを伝搬させることでユーザーがサインインしなくてもSageMaker Studioのジョブを最大90日実行できる機能です
      • デフォルトは7日で、15分~90日の範囲で設定できます
    • ユーザーが電源を切ったり、Identity Centerの有効期限が切れたり、サインアウトしたとしてもジョブは引き続き実行したままにできます
    • 利用にあたってはドメイン作成または更新時にAmazon SageMaker Studioで信頼できるID伝搬を有効化させる必要があるので注意してください

参考リンク

Trusted identity propagation overview - AWS IAM Identity Center

ユーザーのバックグラウンドセッション - AWS IAM Identity Center

Setting up trusted identity propagation for Studio - Amazon SageMaker AI

Amazon DynamoDB が、プロビジョンドからオンデマンド容量への、より頻繁なスループットモード更新をサポート

  • Amazon DynamoDBにてオンデマンドモードからプロビジョンドモードへの切り替えが1日4回できるようになりました
    • これまでは1日に1回のみでした
    • 大量のデータを1日に複数回ロードするユースケースやCloudFormationでのデプロイ・ロールバックがスムーズに実行できるようになります

参考リンク

DynamoDB on-demand capacity mode - Amazon DynamoDB

Amazon SageMaker Studio がトラステッドアイデンティティプロパゲーションをサポート

  • SageMaker StudioにてTrusted Identity Propagation (TIP)をサポートしました
    • AWS IAM Identity Centerの機能でAWSサービス間でユーザーIDを伝搬してくれるという機能です
    • TIPをサポートしたことで、管理者側でSageMaker Studioで実行されたアクションを実際のユーザー単位で追跡できるようになったり、Lake Formation/S3 Access Grantsなどと連携したきめ細かいアクセス制御ができるようになります

参考リンク

Trusted identity propagation with Studio - Amazon SageMaker AI

AWS Systems Manager Automation がランブック実行制御を強化し、無料利用枠を更新

  • AWS Systems Manager Automation(SSM Automation)にて3つの機能が追加されました
    • 事前入力されたパラメータでワンクリック実行ができるようになりました
    • 高負荷時の API スロットリングエラーを自動リトライする機能
    • ターゲット選択時に組織単位 (OU) をより細かく指定できる機能
  • ただしこれまでの無料枠は廃止され、新規アカウントに配布される200ドルクレジットを利用する形になります

Amazon WorkSpaces の導入を効率化された Bring Your Own License (BYOL) プロセスで加速

  • Amazon WorkSpaceのBYOLプロセスが改善され、AWSサポートへの連絡なしにコンソール上でBYOLを有効化できるようになりました
    • 新しいプロセスではEC2 Image Builderのパイプラインを使用して、VMイメージ/ISOファイル/AMIをソースにWorkSpace互換のイメージを自動的に作成する形となります
    • 互換性の問題を解消できない場合にはEC2インスタンスに直接アクセスして修正できるようになっており、イメージの再アップロードする必要もなくなっています

参考リンク

WorkSpaces での Windows デスクトップライセンスの持ち込み - Amazon WorkSpaces

AWS Managed Microsoft AD がディレクトリ共有制限を拡大

  • AWS Managed Microsoft ADのディレクトリ共有制限が拡大され、Standard Editionで5から25アカウントに、Enterprise Editionでは125から500アカウントまで共有可能になりました
    • これまでディレクトリ共有制限を超える場合に複数ディレクトリを構築するといった回避策が必要でしたが、単一のマネージドアカウントから数百のアカウントに対して認証と管理を一元化できるようになり、運用の負荷が軽減できます

Two AWS Managed Microsoft AD with directory sharing, domain joins, and Amazon VPC peering.

参考リンク

Share your AWS Managed Microsoft AD - AWS Directory Service

Amazon VPC が大規模 IP プールに対する IPv4 インバウンドルーティングをサポート

  • VPCにて大規模なパブリックIPアドレスプール宛のインバウンドトラフィックを、VPC内の単一ENIにルーティングできるようになりました

参考リンク

Advanced routing in your VPC - Amazon Virtual Private Cloud

Amazon Athena が Amazon S3 Tables での CREATE TABLE AS SELECT をサポート開始

  • AthenaのCREATE TABLE AS SELECT(CATS)機能が、S3 Tablesにも対応しました
    • CATS: Selectクエリの結果に基づいて新しいテーブルとデータファイルを作成する機能
    • Parquet、CSV、JSON、Apache Iceberg、Hudi、Delta Lakeなどで保存されている既存データセットを、S3 Tablesに移行できるようになります

参考リンク

Amazon Athena を使用してデータを Amazon S3 テーブルに変換する |AWS ビッグデータブログ

Register S3 table bucket catalogs and query Tables from Athena - Amazon Athena

Amazon Q Business がチャットの透明性向上のための Response Events機能 を提供開始

  • Amazon Q BusinessにResponce Events機能が追加されました
    • アップデート文によると、クエリ処理の中でRAGによる検索やファイル処理、プラグインとのやり取りをリアルタイムで確認できるようになったと記載されています
    • これまではブラックボックスだった回答生成の過程が見れるようになり、どのように回答を生成したかわかるようになっています

Amazon Q Business が Agentic RAG を開始し、精度と説明可能性を向上

  • Amazon Q Businessにて新機能であるAgentic RAGが提供開始されました
    • 複雑な質問を送った際にAI Agent側で単純な質問に分割し並列処理をすることで、より正確な回答ができるようになっています

参考リンク

Amazon Q Business features - Amazon Q Business

Amazon Bedrock の Anthropic Claude Sonnet 4 でコンテキストウィンドウが拡張

  • BedrockのClaude Sonnet 4にてコンテクストウィンドウ(一度に処理できる量)が20万トークンから100万トークンと5倍に拡張されました
    • これにより1度に大量のテキストを処理/推論できるようになり、大規模なソースコード分析や、法的契約書/長い研究論文/大規模データセット/技術仕様などのドキュメントを1回のAPI呼び出しで処理できるようになります
    • 利用可能リージョンはオレゴン、バージニア北部、オハイオの3リージョンのみです。20万トークンを超える場合入力で2倍、出力で1.5倍の料金が発生するため注意してください

Amazon SageMaker HyperPod でカスタム AMI がサポート開始

  • SageMaker AIにてSageMaker HyperPodとTraining Job向けにGPUインスタンスであるP6e-GB200 UltraServersのサポートが開始されました
    • 従来のP5enインスタンスと比較して20倍以上のコンピュート性能と11倍以上のメモリを提供し、最大72個のNVIDIA Blackwell GPUを活用できるとのこと
    • Ultra Serverはバージニア北部のダラスローカルゾーンにて、SageMaker Flexible Traing Planを通して利用可能です

参考リンク

Reserve training plans for your training jobs or HyperPod clusters - Amazon SageMaker AI

SageMaker HyperPod が LLM タスクの Topology Aware Scheduling をサポート

  • SageMaker HyperPodにてTopology Aware Scheduling(TAS)が利用可能になりました
    • ネットワークトポロジーを考慮して、ネットワークレイテンシを最小化する形で大規模言語モデル(LLM)のトレーニングタスクを実行できるといったものです

参考リンク

Using topology-aware scheduling in Amazon SageMaker HyperPod task governance - Amazon SageMaker AI

SageMaker HyperPod がコンピュートリソースのきめ細かいクォータ割り当てをサポート

  • SageMaker HyperPodにてインスタンス内のGPU、Trainium Accerarator、vCPU、メモリのきめ細やかな割り当てができるようになりました
    • 機械学習のトレーニングや推論タスクで、リソースの無駄遣いを防ぎ、コスト効率を向上できるとのこと

参考リンク

新しい Amazon SageMaker HyperPod タスクガバナンスを使用して、モデル開発のためにアクセラレーターの使用率を最大化 | Amazon Web Services ブログ

Amazon EC2 シングル GPU P5 インスタンスが一般提供開始

  • EC2 P5インスタンスにNVIDIA H100 GPU 1個を搭載したインスタンスが登場しました

Amazon OpenSearch Serverless が kNN Byte vector と新しいデータタイプをサポート

  • OpenSearch ServerlessにてkNN Byte vectorサポートなど複数の新機能が追加されました
    • kNN Byte vectorサポートにより、パフォーマンスを向上させながら、メモリとストレージを削減できコスト削減できるとのこと

Amazon Neptune が GenAI アプリケーションでのグラフネイティブメモリのために Cognee と統合

  • Amazon Neptune AnalyticsがAIエージェントのメモリフレームワークであるCogneeと統合されました
    • 生成 AI アプリケーションでグラフベースの長期記憶機能を利用できるようになるとのこと

Discussion