📖

re:Invent 2023 セッションまとめ一覧 (Part 2)

2023/11/30に公開

この記事は、re:Invent 2023 で発表されたセッションで公開されているコンテンツの一覧の Part 2 です。

re:Invent 2023 のセッション一覧(随時更新中)

セッション数:Keynotes (5), Innovation Talks (17), Breakout Sessions (676)

Breakout Sessions

Breakout Sessions は最新のユースケースやアーキテクチャのベストプラクティスなど幅広い有益なトピックについてのセッションです。

ARC207: AWS が新サービス「 AWS Repost Private 」を発表 - 組織内の知識共有と構築を支援

  • AWS(Amazon Web Services) は新しい管理型サービス「 AWS Repost Private 」を発表した。これはお客様独自の知識ネットワークを構築し、組織内で知識を共有できるサービスだ。
  • AWS Repost Private を利用すると、お客様独自のコミュニティを構築し、独自のコンテンツをカレーション、組織内でコラボレーションできる。
  • 学習パスの作成、質問の投稿、記事の発行、専門知識の構築などの機能を提供する。
  • 知識の空白、イノベーションの速度、仮想コラボレーションの実現などの課題に対応する。
  • 知識ネットワーク構築のベストプラクティスとして、エキスパートの特定、学習パスの構築、コミュニティの形成、ゲーム化、ネットワークのオートメーションなどが紹介された。
  • AWS 自身が 300 以上のサービスを把握するために、技術分野コミュニティをどのように活用しているかの例が示された。

ARC208: AWS の新サービス「 Elastic Disaster Recovery 」を活用した災害復旧戦略

  • AWS の新サービス「 Elastic Disaster Recovery 」が秒単位の Recovery Point Objective(RPO) と分単位の Recovery Time Objective(RTO) を達成
  • 非同期ブロックレベルレプリケーションで低コストで継続レプリケーションを行いながらも RPO を低く保つ
  • VPC 設定とデータをレプリケーションし、復旧環境が適切に設定されるよう保証
  • 非破壊的なドリルで災害復旧テストが可能で、本番環境に影響なし
  • アプリケーションレベルテストもドリルに統合可能
  • ランサムウェアからの回復をサポートし、別アカウントに不変のバックアップを保持。検出ツールと連携し最新のクリーンな状態から復旧
  • 復旧目標、展開パターン、バックアップポリシー、保護対象を定義し、適切なソリューションを選定

ARC211: クラウドソリューションアーキテクトとなる道筋と必要なスキル

  • ソリューションアーキテクトはビジネスニーズを受けて、技術アーキテクチャを設計しビジネス問題を解決する自身のキッチンのシェフ的存在である
  • ソリューションアーキテクトとなる道筋として、新技術を提案するインベンタータイプ、ビジョンを伝えるエントレプレナータイプ、リピータブルパターンを作成するコンポーザータイプ、カスタマーセンタードなソリューションに焦点を当てるアドボケイトタイプがある
  • ソリューションアーキテクトに必要なスキルとして、基盤技術の習得、PoC の構築、他者の教育、ビジネスドメインや財務の理解、好奇心、勇気、確信、コミュニケーション力などのソフトスキルがある
  • AWS は認定試験、AWS Skills Builder のコース、アーキテクチャベストプラクティスの AWS ソリューションライブラリ、AWS フォーラムで質問に答えることによる他者教育ツールをアーキテクトのために提供した

ARC216: AWS Well-Architected 構成のベストプラクティスを組織全体に拡大する方法

  • AWS は、AWS Well-Architected ツールに新機能としてレンズカタログをリリースし、コンプライアンス、ヘルスケア、サーバーレス、IoT などのトピックに関する業界固有および技術固有のレンズを導入しました
  • MuleSoft は、自社のクラウドオペレーティングモデルとスケール可能なベストプラクティスを構築するために AWS Well-Architected フレームワークを利用しました
  • MuleSoft は、Well-Architected の採用を推進する Cloud Oversight Engineering チームを設立し、各チームのステークホルダーと協力しました
  • MuleSoft は、AWS からのコストとオペレーションデータをエンリッチし、Cloud Central ポータルで提供するデータレイクハウスを開発しました
  • MuleSoft は、コスト最適化、オペレーショナルエクセレンス、信頼性、セキュリティのピラーを優先し、アナリティクスインフラの改修や AWS Systems Manager によるパッチ適用などのプロジェクトを完了しました
  • MuleSoft の Cloud Central ポータルでは、エンジニアリングチーム向けのカスタマイズされた Well-Architected ピラー、推奨事項、目標が自己サービスで閲覧できます

ARC305: アマゾンの大規模なサービスで使用されたレジリエントなアーキテクチャの事例

  • アマゾンは Amazon.com、Amazon Music、Amazon Prime Video、Ring、Alexa から resilient なアーキテクチャの例を共有した
  • 例ではマイクロサービス、セル構成、自動スケーリング、分離されたアーキテクチャ、ケイオスエンジニアリング、マルチアカウントの観測が使用された
  • Ring はイベント駆動型アーキテクチャを構築し、6ケタの可用性を実現しながら 100,000 リクエスト/秒を処理できる大規模なスケーラビリティを達成した
  • Amazon Music はデバイスタイプとイベントティアにルーティングするセル構成を実装し、アウトレージの範囲を 92% 縮小し可用性を向上させた
  • Prime Video と Amazon Music はセル構成の実装後、可用性とレジリエンスが向上した
  • Audible は AWS Cross-Account Observable を実装し、ログ、トレース、メトリクスをアカウント間で相関付けることで、デバッグ時間を2時間から 20-30 分に短縮した

ARC306: マイクロサービスの分散アーキテクチャと障害への耐性向上

  • アリスのコーヒーショップは、単一インスタンスの注文管理アプリケーションと1時間毎のデータベースバックアップから始まった
  • ビジネスが拡大するにつれ、アリスはマイクロサービスを実装し、障害の影響を軽減するために複数の AWS アベイラビリティゾーンにデプロイした
  • 影響をさらに軽減するために、アリスはマイクロサービスの複数コピーをデプロイし、ストアを異なるセル/インスタンスにマッピングするセルベースアーキテクチャを採用した
  • 重要な注文処理システムでは、シャッフルシャーディングを実装し、ユーザーを異なるサーバーに分散することで、単一ユーザーに影響を及ぼす可能性を軽減した

ARC307: 近年のクラウドアプリケーションの利用がアプリケーションの他システムへの移行を困難にするか

  • 近年のクラウドアプリケーションのトレードオフと、クラウドサービスの利用がアプリケーションの他システムへの移行をより困難にするかどうかについて議論された
  • ベンダーロックイン、製品ロックイン、スキルセットロックイン、メンタルロックインなど、ロックインの様々な側面が議論された
  • ポータビリティの観点からは、サービスマッピングやアブストラクションレイヤの利用は適切ではないと議論された
  • マネージドオープンソースは、機能性は保持しつつスイッチングコストを低減できるため推奨された
  • オートメーション、リーンプラクティスなどを活用したアプリケーションのベロシティ向上は、スイッチングコストを劇的に低減できるため推奨された
  • サービスセレクションに焦点を当てるのではなく、デザイン意図と意思決定を保持することで、メンタルロックインとスイッチングコストを低減できる

ARC308: - 一社のフィンテク系小売銀行が、Amazon Aurora グローバルデータベースなどのサービスを利用したウォームスタンバイ型マルチリージョンアークテクチャの導入により、災害復旧戦略と運用継続性を高めた。ゲームデイやフォルトインジェクションテストなどのベストプラクティスを活用した。

  • 一社のフィンテク系小売銀行が、Amazon Aurora グローバルデータベースなどのサービスを利用したウォームスタンバイ型マルチリージョンアークテクチャの導入により、災害復旧戦略と運用継続性を高めた。ゲームデイやフォルトインジェクションテストなどのベストプラクティスを活用した。
  • オンライン認証プロバイダーが、パフォーマンスと可用性を向上させるために認証 API を複数リージョンに展開した。Route53、DynamoDB グローバルテーブル、アプリケーションリカバリーコントローラ (ARC) などのサービスを利用し、リージョン間のインテリジェントルーティング、データレプリケーション、レディネスチェックを実施した。

ARC309: AWS は障害が発生したアベイラビリティゾーンから自動的にトラフィックを移行する「ゾーナルオートシフト」という新サービスを発表した。このサービスはオプトインした顧客に対して AWS が行う。ゾーナルオートシフトは、マルチリージョン・マルチ AZ アプリケーションの回復を支援する「 Amazon Route 53 Application Recovery Controller 」サービスの一部。ゾーナルオートシフトでは、アベイラビリティゾーンで潜在的な影響が検知された場合に AWS が自動的にゾーナルシフトを実行する。顧客はゾーナルオートシフトにオプトインし、シフト時に余分なトラフィックを処理できるだけの残りの AZ の容量を確保する必要がある。

  • AWS は、障害が発生したアベイラビリティゾーンから自動的にトラフィックを移行する「 Zonal Auto Shift 」という新サービスを発表した。このサービスはオプトインした顧客に対して AWS が行う。
  • Zonal Auto Shift は、マルチリージョン・マルチ AZ アプリケーションの回復を支援する「 Amazon Route 53 Application Recovery Controller 」サービスの一部。
  • Zonal Auto Shift では、アベイラビリティゾーンで潜在的な影響が検知された場合に AWS が自動的にゾーナルシフトを実行する。
  • 顧客は Zonal Auto Shift にオプトインし、シフト時に余分なトラフィックを処理できるだけの残りの AZ の容量を確保する必要がある。

ARC310: グレー障害の検知と緩和

  • グレー障害とは、異なる視点から見た場合に異なる障害として観察される障害のこと。基盤システム側では正常と判断される一方で、顧客側からは障害が発生している場合がある。
  • グレー障害を検知するには、AWS サービスのデフォルト機能だけでは不足し、追加の計測とメトリクスが必要。可用性ゾーンなどのフォルト分離境界をメトリクスに反映する必要がある。
  • 単一ホストまたは単一 AZ のグレー障害は、外れ値検知と複合アラームを利用して検知できる。
  • 単一ホスト障害は、不健康なインスタンスを交換。単一 AZ 障害は、Application Recovery Controller のゾーナルシフト機能やスクリプトを利用して、AZ からエバキュエーションを実施。

ARC311: マルチテナント SaaS アーキテクチャのコスト最適化戦略に焦点を当てたセッションで、eコマースソリューションのケーススタディから、基本ティアテナントが大きな製品カタログのために低収益でインフラコストを高く引き起こしていたことが判明した。テナント活動とリソース消費のより良い調和が必要であることが示された。

  • 新しいサービスや機能のアナウンス:なし。このセッションでは、マルチテナント SaaS アーキテクチャのコスト最適化戦略に焦点を当てた。
  • カスタマーケーススタディ :e コマースソリューションのケーススタディを紹介し、テナント消費プロファイリングにより基本ティアテナントが大きな製品カタログのため低収益でインフラコストを高く引き起こしていることが判明した。これはテナント活動とリソース消費のより良い調和が必要であることを示した。

ARC312: AWS 上のレジリエンスのためのメンタルモデルである「レジリエンスライフサイクル」

  • AWS レジリエンスライフサイクルには5つのフェーズが含まれている:目的設定、設計と実装、対応と学習、評価とテスト、運用
  • バンガードは自社のアプリケーションと組織のレジリエンス向上のために AWS レジリエンスライフサイクルを導入した
  • バンガードはレジリエンス取り組み全体を監督するテクノロジーレジリエンス組織を設置した
  • バンガードは性能テストやカオスエンジニアリング実験のためのツール PTAS などを自社開発した
  • バンガードは分散トレースとエンタープライズヘルスダッシュボードの導入により観測可能性を強化した
  • バンガードはリリース管理の自動化とレジリエンステスト、ポリシーの実装を行った
  • バンガードは MTTR の 60% 短縮、デプロイ回数5倍増加、インシデント 30% 削減などの改善を見た

ARC313: 重要な業務負荷のレジリエンス分析に対する一貫したアプローチ

  • 顧客がワークロードを分析し、一貫性のある繰り返し可能なプロセスでレジリエンスを高めるためのレジリエンス分析フレームワーク (RAF) を導入しました。
  • RAF では共通運命、過剰負荷、過剰応答時間、設定ミス、バグ、単一障害点などの障害カテゴリに焦点を当てています。
  • RAF には、ワークロードのモデリング、障害モードの理解、障害の観察、予防対策や是正対策による障害軽減を考慮した対策などが含まれています。
  • メタデータデータベースの過剰負荷、非同期レプリケーションを使用した地域間の障害隔離、ヘッジングを使用したテールレイテンシの低減、障害隔離境界と整合する展開などの例が挙げられました。
  • AWS アプリケーションリカバリーコントローラーチームは RAF を運用化し、ルーティング制御、ゾーンシフトなどのサービスを改善しました。
  • RAF を実装した教訓として、経営陣の支援、専任エンジニアの必要性、運用と開発プロセスへの統合、分析に基づく継続的なシステムの改善が挙げられました。

ARC315: 正式な方法による分散システムの設計と頑健性の確認

  1. P は分散システムの設計の正しさと頑健性について論理的方法を適用することで確信を得るためのフレームワークだ。
  2. P は分散システムを協調状態マシンとしてモデル化し、全ての可能な動作を体系的に探索することで、システムが希望する仕様を満たすかどうかをチェックできるプログラミング言語を提供する。
  3. AWS のチームは Amazon S3 の強一貫プロトコルなどのシステムの開発時に早期にバグを見つけるためにPを利用している。
  4. AWS の顧客として、設計時に実装前に重要なワークロード、アーキテクチャ、混沌工学、災害復旧をPで検証できる。
  5. 講師はPでトランザクション処理システムをモデル化し、テストを実行することで難易度の高いバグを見つけ、障害シナリオを検証する例を提供した。

ARC316: アマゾンがプライム・ビデオの高可用性と耐障害性をスケールさせる方法

  • プライム・ビデオは「グローバルで考え、ローカルで実行する」と呼ばれる高可用性サービスと耐障害性をスケールさせるための確立されたプロセスを構築している。
  • オペレーションの卓越性、サービスの耐障害性、観測可能性、レポートを最優先事項と位置付けている。
  • プライム・ビデオは各リージョンで週3回「ゲームデイ」と呼ばれる負荷テストを実施し、ピークワークロード容量をテストし問題点を特定している。
  • さまざまなシナリオ(サブスクリプション、再生等)が並行して実行されピークイベントをシミュレートできる「 WA 」というツールを作成し負荷をモデリングしている。
  • プライム・ビデオは Fault Injection Service、SSM Chaos Runner などのツールを使い予定外とパイプライン内でカオスエンジニアリング実験を実施している。

ARC317: AWS の新サービス「 Fault Injection Service(FIS) 」を活用したマルチ AZ ・マルチリージョンアプリケーションの耐障害性テスト

  • AWS の新サービス「 Fault Injection Service(FIS) 」を発表し、マルチ AZ およびマルチリージョンアプリケーションの耐障害性をテストできるシナリオを追加
  • 1 つの AZ で電源停止が発生した場合のアプリケーションの応答をテストできる新しいマルチ AZ 電源中断シナリオ
  • プライマリリージョンがアクセス不可になった場合のアプリケーションの動作をテストできる新しいクロスリージョン接続シナリオ
  • 3 つの AZ にまたがる NLB 後方のサンプルアプリケーションでマルチ AZ 電源シナリオをデモ

ARC319: Amazon QuickSight のクラウドインテリジェンスダッシュボードを使用して、AWS のコストと使用データの可視化や最適化、追跡が可能

  • Amazon QuickSight に用意されたクラウドインテリジェンスダッシュボードを使用して、AWS のコストと使用データを可視化できる
  • 組織はコストの最適化、セキュリティと耐障害性の向上、大規模なクラウドリソースの運用が可能になる
  • Dolby Laboratories はクラウドインテリジェンスダッシュボードを使用して AWS コストの追跡と最適化を行い、インターネットデータ転送の最適化で年間 8.4 万ドルのコスト削減効果があった
  • ダッシュボードを使用して GP3 に EBS ボリュームの移行によるコスト削減や Compute Optimizer からのライトサイジング推奨内容の追跡が可能
  • ダッシュボードを使用してエンジニアリング、ファイナンス、製品チーム間でデータドリブンな意思決定に基づく最適化への協力が可能

ARC327: 大規模 AWS サービスのスケーラビリティと信頼性の両立法5つ

  • 大規模な AWS サービスを運用する実例から、スケーラビリティと信頼性を両立するための5つのポイントが紹介された
  • エラータイプの分類 (400 エラーと 500 エラー)とシグナルとノイズの区別が、問題発見時間を短縮する
  • 変更の影響範囲を限定するとともに、個別の障害範囲をモニタリングすることで影響を小さくできる
  • 不調時のキューの増加への対策として、サービス外部排除、バックプレッシャー、迅速な排出が紹介された
  • 再試行は不調時の追加負荷を引き起こす可能性があるので、スロットリングなどの技術が回復を助ける

ARC329: メルセデス・ベンツが修理サービスの IT システムをクラウドファーストで移行する

  • メルセデス・ベンツが修理サービスの IT プラットフォームをクラウドへ移行することを発表
  • 修理サービス関連の全アプリケーションを AWS ホスティングの共有クラウドプラットフォームに移行
  • プラットフォームの目的は修理サービスシステム間の壁を取り除き、協業を可能にすること
  • 主な利用技術は EKS、Lambda、CodeDeploy クラスタなどの AWS サービス
  • OpenTelemetry で全アプリケーションのログとモニタリングを集約
  • Safe Agile フレームワークでチーム間の協業と定期的な計画、リリースを促進
  • アプリケーション導入、サポート、AWS 学習などのサポートチームを新設
  • 初期ケーススタディでは新プラットフォームが修理サービスのデジタルカスタマーエクスペリエンス向上に役立った

AUT102: ボルボと TRATON のクラウドファーストなインテリジェントなコードパイプライン

  • TR グループは機能ドメインを構築しゾーンアーキテクチャを適用することで開発と運用コストを削減し、市場投入時間を短縮している
  • ボルボは QNX AM を AWS Graviton ノード上で動作させることで、より早期にバグを特定し、コード品質を向上させ、ハードウェアラボへの依存を低減できる
  • AWS はクラウドネイティブな自動車ソフトウェアの概念化、仮想 ECU とワークベンチの提供、統合ツールとテクノロジーの支援ができる

AUT202: BMW と Qualcomm が AWS 上で自動運転プラットフォームを構築した

  • ベムワーは 2025 年から生産開始となる新型車「ノイエ・クラッセ」に搭載する高度な自動運転機能の開発を AWS 上の自動運転プラットフォームを用いたデータ主導のプロセスで行っている
  • ベムワーは Qualcomm と提携し、SoC と安全性・運転支援機能の開発を共同で行っている
  • プラットフォームは世界中の数百台の車からデータを収集し、コンピュータビジョンと AI を用いた自動運転機能の開発とテストを行っている
  • プラットフォームは AWS 上で膨大なデータの取り込み、保存、処理、シミュレーションを行い、開発サイクルの短縮とイノベーションの向上を図っている
  • トヨタコネクテッドは4ヶ月間のゼロダウンタイムで Drive Link プラットフォームを Azure から AWS に移行
  • 移行で使用した主なサービスは Amazon EKS, Amazon MQ, MongoDB Atlas, Redis
  • AWS プロフェッショナルサービスはアーキテクチャガイダンス, セキュリティベストプラクティス, スケーラビリティサポートのためトヨタチームに DevOps エンジニアを派遣
  • 今後の計画は安全接続サービスをモバイルアプリに展開し、カスタマーエクスペリエンス向上のため生成型 AI の利用

AUT206: Torc Robotics が AWS を利用して開発した自律走行シミュレーションテストプラットフォームについて

  • Torc Robotics は AWS を使用して自律走行レベル4機能のシミュレーションテストを数百万マイル実行可能なデジタルテストプラットフォームを構築した
  • S3、EKS、EC2、Lambda、Step Functions などの AWS 管理サービスだけを使用してスケーラブルなプラットフォームを設定した
  • Torc Robotics は単一の EKS クラスタでのシミュレーションスケーリングでテストの決定性に影響がある課題に直面した
  • API Gateway、Lambda、DynamoDB、Step Functions などのサービスを使用してシミュレーションスケジューリングと仮想ドライバーのオーケストレーションを分離する設計に再設計した
  • 新しい設計により並列処理、一貫性、正確性の向上と信頼性の向上が可能になった
  • サービスを使用することで需要に応じた数百万シミュレーションを最小限の調整でスケールできるようになった
  • DataDog などを使用して Lambdas、EC2 インスタンスの観測性とログのエンリッチメントを行った
  • Torc Robotics は長距離トラック輸送用レベル4オートノミアストラックの商用化を Daimler Truck とのパートナーシップで目指している

BIZ103: アメリカ陸軍のテレメディシン実験センターが AWS と提携し、AWS Wickr と AWS プライベート 5G を利用した遠隔医療ネットワークの構築

  • 米陸軍テレメディシン・アドバンスド技術研究センター (TATRC) は、国立遠隔集中医療ネットワーク (NETCCN) を AWS Wickr と AWS プライベート 5G を利用して構築するために AWS とパートナーシップを結んだ
  • NETCCN は、Wickr とプライベート 5G を利用して、現場と遠隔の医療チーム間で AI ドリブンなエンゲージメントを通じたリアルタイムな患者ケアを可能にするセキュアでプライベートなセルラーネットワーク機能を有する
  • Medic P は、TATRC のためにデロイトによって Wickr の上に構築されたソリューションで、軍事現場医療のための資源限定的なテレヘルスを対処する仮想医療ワークフロー、エッジサーバーにおける粗末なネットワーク、プライベート 5G 接続を有する

BIZ105: ウッドサイド・エネルギーは AWS サプライチェーンを導入し、メンテナンス業務の計画から資材の配送までを効率的に追跡できるようになった

  • ウッドサイド・エネルギーは、メンテナンス業務の計画から実施時の資材の配送までを効率的に追跡できるように、AWS サプライチェーンを導入した
  • AWS サプライチェーンは、協業機能やデータ統合の強化により、上流のサプライヤとの連携性を高める新機能を追加した
  • ウッドサイドは、AWS サプライチェーンの Order Insights モジュールを試験運用し、メンテナンス業務オーダーと資材の追跡が可能になり、現場スタッフ、調達、物流の可視性が上がった

BIZ107: イベルドローラが提供する「 Advanced Smart Assistant 」――持続可能な未来のためのエネルギー管理のデジタル化

  • Iberdrola は 2023 年5月、エネルギー移行において顧客が積極的な役割を果たせるコネクテッドエネルギーソリューション「 Advanced Smart Assistant 」をリリースした。
  • 同ソリューションは AWS 上で Deloitte がサービスプロバイダとなり運用し、AI/ML サービスを利用してスマートデバイスのエネルギー消費を 10~30% 削減できる。
  • モバイルアプリを通じて利用状況、消費パターン、節約可能領域を理解できるシンプルなエクスペリエンスを提供する。
  • 建物の熱イネルギーを考慮し、エアコンの消費を削減できる。
  • 同ソリューションは一つのプラットフォーム上で室内機、ヒートポンプ、EV、ソーラーパネルなど多くのスマートデバイスを接続し、エネルギー使用と節約の最適化のために自律的な意思決定が可能。
  • 可再生エネルギー使用を優先し、CO2 排出量削減。
  • 同プラットフォームには効率的な運用、請求額の大幅な削減、お客様にとって環境に優しいソリューションが提供される。

BIZ109: AI を活用した SaaS アプリケーションの革新で従業員の生産性向上を図る

  • AWS App Fabric は生産性向上を目的としてアナウンスされ、SAS アプリケーション間のコンテキストスイッチングを軽減し、ユーザー体験をより充実させることを目指しています。
  • 複数の SAS アプリケーション (Atlassian, Jira, Miro, Slack, Smartsheet, Google, Microsoft 365 など)からのコンテキスト情報を使用して洞察とアクションを生成します。
  • アプリケーション間の統合を完全に管理し、アプリ間で利用できるデータを自動的に標準化します。

BIZ209: フェラーリと Dynata が機械学習を使って F1 ファンのエンゲージメント向上を図った

  • フェラーリは AWS サービスを使用したセグメントと ML に基づく個人化を使用して、F1 ファンのエンゲージメントを向上させるために AI と機械学習を活用したイベント通知の自動化を実演した
  • Dynata は SMS、プッシュ通知、Eメール、ボイスコールなどの通信機能を既存スタックに追加するために AWS コミュニケーション開発者サービスを使用し、カスタマイズされたEメールによって収益を増加させた
  • フェラーリは機械学習を使い、デジタル変革を加速し、推奨事項の個人化を簡単に統合できる Amazon Personalize を使用してファンエンゲージメントを向上させた

BIZ210: AMD EPYC Genoa プロセッサを活用した新規ワークロードの効率的なデプロイ

  • AMD EPYC プロセッサは前世代と比べてパフォーマンスが最大2倍向上している
  • 新しい EC2 7 世代インスタンスは AWS により AMD EPYC Genoa プロセッサをベースに最適な x86 パフォーマンスと価格性能を提供するよう設計されている
  • AMD EPYC Genoa プロセッサは前世代の AMD Milan プロセッサと比べパフォーマンスが最大 50% 向上している
  • ベンチマーク結果に基づき、AMD EPYC Genoa プロセッサを使用することで、フットプリントを 37% 小さくし、コストを 27% 低減できる
  • 某金融サービス企業は AMD EPYC パワードインスタンスに移行することで、100 万ドルの支出ごとに 38 万ドルのデータベース支出削減が可能となった
  • AMD EPYC プロセッサは他の x86 プロセッサと比べて電力消費が 30% 低減し、温室効果ガス排出量も 30% 低減する

BIZ211: 混在環境での観測性のベストプラクティス

  • スプランクが hybrid 環境で OpenTelemetry 標準を使用したログ、メトリクス、トレースの収集によるエンドツーエンドの視認性を提供する Observability Cloud サービスを発表した
  • Observability Cloud はマイクロサービスが異なるクラウドとデータセンターに跨がって動作する関係を示す近リアルタイムのサービスマップを提供する
  • コード配備が他のサービス、顧客、ビジネスアウトカムに及ぼす影響をアプリケーションパフォーマンスモニタリングとリアルユーザモニタリングを使用して測定できる

BIZ212: 「 AWS の新サービス AppFabric - 生成型 AI を利用した SaaS アプリケーションの生産性向上」

  • AWS の新サービスである AppFabric が発表されました。このサービスは、生成型 AI を利用してソフトウェアアズアサービス (SaaS) アプリケーション間のデータを結合し、アプリケーション横断の洞察を提供します。
  • AppFabric は複数の SaaS アプリケーションとの統合をフルマネジドで行い、データを標準化することでアプリケーション間で利用できる形式に変換します。これにより開発者は AppFabric の生産性機能をアプリケーションの UI に直接組み込み、ユーザーに一貫したアプリケーション体験を提供できます。
  • アサナは AppFabric を利用して、複雑なアプリケーションスタック上で SaaS アプリケーション間を結合することでセキュリティ姿勢を強化しています。

BIZ213: AWS App Fabric を利用して SaaS アプリケーションのセキュリティ監視性を向上する

  • AWS App Fabric は、組織内で展開された主要な SAS アプリケーションを好みのセキュリティツールと簡単に接続する完全管理型サービスです。監査ログを正規化し、豊富にします
  • 14 種類のアプリケーションから監査ログを集約、正規化、豊富化を行い、年末までに 30 種類以上のアプリケーションをサポートする予定です
  • ログデータのフォーマット(生データまたは正規化データ)、送信先 (S3 バケット、Kinesis Data Firehose) の選択が可能で、Splunk、Amazon Security Lake などの送信先に対応しています
  • セットアップは3ステップで簡単で、アプリバンドルの作成、アプリケーションの承認、コーディングなしでインジェスト設定の提供が可能です
  • ポイントツーポイントの統合、データパイプライン管理、さまざまな SAS アプリケーション間の正規化の課題に対処します

BIZ216: Amazon Connect と生成 AI のコンタクトセンターに向けた最新動向

  • Amazon Connect は SMS 連携機能を直接プラットフォーム内でサポートするようになりました
  • WebRTC を利用した Web ベースコーリング機能が新たに提供され、アプリ内や Web 上からのコーリングが可能になりました
  • 顧客サービスやエージェント支援のセルフサービス体験を実現するために、Amazon Q などの生成 AI が利用されるようになりました
  • Capital One によるアウトバウンドダイヤラーの Amazon Connect 移行事例で、接続率は 30% アップしたことが報告されました
  • スーパーバイザ向け新たなダッシュボードと分析機能が提供され、メトリックスのフィルタリングと可視化が向上しました
  • 顧客プロファイルプラットフォームは、生成 AI を利用し、異なるシステム間の顧客データのマッチングとインポートを支援するようになりました
  • エージェント向けの手順書作成はノーコード UI ビルダーを利用できるようになりました
  • サードパーティー製アプリケーションは Amazon Connect エージェントデスクトップ内に直接統合できるようになりました

BIZ217: DISH は Amazon Connect を活用し、コンタクトセンターとエージェントの成功をスケールさせた

  • DISH は2週間以内に1万 5,000 件のエージェントを Amazon Connect に移行し、AWS サービスと専門知識を活用した
  • DISH は1時間当たり 25% 多くの通話が処理できるようになり、放棄率が低下し、通話後の業務効率が向上した
  • Amazon が AI 応答の生成型 AI 「 Amazon Q 」、手順書のノーコードビルダー、エージェントワークスペースのサードパーティアプリ連携を発表した
  • DISH は AI 推奨、コンテキスト情報、CRM データの埋め込みを通じてエージェント体験の向上を目指す

BIZ218: Amazon Connect を利用した多チャンネルな顧客体験のパーソナライゼーション

  • Amazon Connect の SMS 機能が一般提供となり、コンタクトセンターの管理者が音声通話やタスクと同様の設定、ルーティング、分析が可能となった
  • Amazon Connect でアプリ、Web、ビデオ通話機能が一般提供となり、単一のスニペットコードでモバイルアプリと Web アプリから音声通話とビデオ通話が提供可能に
  • Adobe は過去のチャットと音声プラットフォームから Amazon Connect に移行し、グローバル顧客に対するシームレスなマルチチャンネル体験を提供
  • Amazon Connect を使用することで、Adobe は過去3ヶ月以上かかっていた新規コンタクトセンター開設を3週間以内に実現し、ビジネスのアジリティを向上
  • Adobe は Amazon Connect の分析機能と A/B テストを利用し、チーム間の転送を減らすことで顧客体験の向上を図った
  • Adobe は Amazon Connect プラットフォームで翻訳と地域依存サービスを利用し、68 ヶ国の顧客に母国語でサポートを提供
  • Adobe は過去のチャット移行時の設定と統合が引き継がれたため、Amazon Connect プラットフォームでシームレスなマルチチャネル移行が可能となった

BIZ219: Amazon Connect を活用した顧客サービスの最適化と洞察力の獲得

  • Amazon Connect は、顧客がリソースニーズを計画するのに役立つ予測、キャパシティプランニング、スケジューリング機能を導入しました
  • Contact Lens は、会話の要点を素早く理解するために、会話の AI による生成型要約を提供するようになりました
  • リアルタイム会話アナリティクスダッシュボードとゼロ ETL アナリティクスデータレイクが、会話から得られる洞察を提供するためにリリースされました

BIZ220: ジョン・ハンコックのメインフレーム保険管理システムを DXC テクノロジーの助けを借りて 13 ヶ月で AWS クラウドに移行し成功した

  • メインフレームから AWS クラウドへの重要アプリケーションの移行を DXC テクノロジーの助けを借りて記録時間 13 ヶ月で成功裏に移行した (John Hancock)
  • 新製品の迅速な市場導入、スケーラビリティと信頼性の向上、総コスト削減目標の達成が可能となった (John Hancock)
  • 下流システムとの統合とコンプライアンス、災害復旧への対応が主な課題であった
  • プロセスの効率化、API や継続的なデジタルトランスフォーメーションの活用による新規デジタルサービスの開発などが事業面でのメリットである

BIZ222: Amazon Connect の進化―生成型 AI 機能で顧客対応を変革

  • Amazon Connect は、エージェント支援の Amazon Q、管理者向けの通話後コンタクトサマリ、自然言語ボットビルド機能など、生成型 AI の機能を新たに発表した
  • Amazon Q は、エージェントが顧客の問題をより速く解決できるよう、簡潔な回答と手順書き指南を提供
  • 通話後コンタクトサマリは、管理者がコーチング機会をより速く特定できるよう、通話の簡潔なサマリを提供
  • 自然言語ボットビルド機能では、用途を文脈で説明することで自動的に初期ボットを生成
  • Orbit Irrigation 社は、Amazon Q を使用して各コンタクトごとの時間を 10-15% 短縮
  • Choice Hotels は、生成型 AI を使用してデータマッピングを自動化し、宿泊客プロファイルを向上
  • Yan Connect 社は、生成型 AI 機能を使用開始することで、エンジニアリング作業なしで直ちに開始できることが顧客から評価されていると述べた

BIZ223: Amazon Connect の新機能で顧客エンゲージメントを広げる

  • Amazon Connect は、モバイルアプリやウェブサイトから直接企業に連絡を取れるインアプやウェブコール、ビデオ、SMS 機能を新たに導入した
  • ナショナルウェスト銀行は、モバイルアプリとコンタクトセンター間のスムーズな認証と交流を可能にするために、これらの新機能を導入している
  • 韓国航空や富士通などの他の顧客も、任意のデバイスから連絡を取れるインアプとウェブコールを導入している
  • アレジアント航空は、Amazon Connect SMS を導入した結果、顧客満足度が上昇した

BIZ224: 3M は AI と自動化で顧客サービス組織を変革する

  • 3M は、顧客体験とサービス提供を変革するために、AWS 上にセールスフォース・サービスクラウド・ボイスを展開した
  • 数か月で世界各国の 3,000 人のエージェントにグローバルに展開できたため、以前の展開よりもはるかに短期間で実装できた
  • 3M は、エージェントの効率性向上、ケース解決の短縮、標準化されたグローバル運用、作業負荷の自動分散などの利点を実感している
  • 3M は、エージェントアシスタンス、コールの逸脱、自動化、サービスクラウド・ボイスの AI 機能などの機能を活用し、年間 400 万件のケースの 100 万件削減を目指している

BIZ226: Amazon Connect と Amazon Lex は、自然言語の説明からチャットボットを構築できる説明型チャットボットビルダーや会話型 FAQ 機能などを発表した。Doordash は Amazon Connect と Lex を利用して IVR を会話型に移行し、IVR での待ち時間と転送率を削減したケーススタディも発表した。

  • Amazon Connect と Amazon Lex は、自然言語の説明からチャットボットを構築できる説明型チャットボットビルダー、訓練データを生成するアタレジェネレーター、生成 AI を利用したスロット解決を行うアシストスロット解決など、生成 AI 機能を含む新機能を発表した
  • Amazon Connect と Amazon Lex は、Amazon Kendra などの知識ベースを利用し、定義済インテント以外の質問にも答えられる会話型 FAQ 機能も発表した
  • Doordash は、Amazon Connect と Lex を利用して IVR を会話型に移行し、IVR での待ち時間を 42%、転送率を 49% 削減したケーススタディも発表した

BIZ227: ボルボが SAP と生産現場との間で双方向データ交換とリアルタイム分析を可能にする耐障害性の高い統合ソリューションを AWS 上に導入した

  • ボルボが SAP と生産現場との間で双方向データ交換とリアルタイム分析を可能にする統合を実装した
  • 統合ソリューションは AWS をベースにサーバレスアーキテクチャを採用し、AWS と SAP 間での耐障害性、スケーラビリティ、疎結合性を実現
  • ソリューションは1日あたり2万件超の生産確認データを信頼性と安定性を保ちながらデータ損失なく処理
  • ソリューションは SAP サイドバイサイド拡張として AWS 上に導入し、コア SAP システムをクリーンに保ちつつクラウドサービスでイノベーションを図る
  • 統合により生産計画の可視化、リアルタイム分析による供給網障害検知、AI による生産推奨サービスなどが実現
  • ソリューションは標準化・再利用可能な形で他のボルボ工場にも展開予定

BLC101: AWS 上で NFT ドロッププラットフォームとマーケットプレイスを構築する

  • マテルが「ホットウィールズ NFT ガレージ」を立ち上げ、1,500 万以上の NFT と1万 5,000 以上のアクティブウォレットで運用している
  • マテルはウェブ 2.0 からウェブ 3.0 へのスケールとウェブ 2.0、ウェブ 3.0 両方のユーザーに対するシームレスなユーザーエクスペリエンスを提供するソリューションが必要だった
  • マテルはマルチチェーンウォレット、KYC、クリプト充当機能と連携するフェデレーテッドアイデンティティサービスが可能な Magic ウォレットを利用
  • マテルは収集家がトイを購入、取引、仲間と交流し、仮想コレクションを構築できるメタバースマーケットプレイスを立ち上げ
  • マテルはレア NFT 保有者に実世界のトイの物理バージョンを換金できるトークンをエアドロップするデジタルツインアプローチを利用
  • マテルプラットフォームは複数のブランドイニシアチブとパートナーシップに利用され、規模を拡大している

BLC102: - 三菱 UFJ 銀行とウニバンコは AWS のブロックチェーン管理サービス、暗号化技術、鍵管理サービスを利用した個人投資家と機関投資家向けの暗号資産管理ソリューションを発表した

  • イタウ・ウニバンコは AWS サービスの Amazon Managed Blockchain、Nitro Enclaves、KMS を利用した個人投資家と機関投資家の両方向けの暗号資産カスタディソリューションについて発表した
  • フィデリティは Ethereum と Polygon ブロックチェーンを利用し、スマートコントラクトで米国債と MMF のような金融資産をトークン化するプラットフォームについて発表した
  • Amazon Managed Blockchain は現在 Polygon ブロックチェーンをパブリックプレビューでサポートしており、Oasis Pro や Mystic Moose のような顧客はそれを利用して分散型アプリやゲームを構築している

BOA201: AWS 上で Go 言語アプリケーションを構築・運用する方法

  • Go プログラミング言語の基本と主要な機能について
  • App Runner、Lambda、ECS/Fargate など AWS 上で Go アプリケーションをデプロイするオプション
  • Amazon Lexicon、L-Chain を使用した生成型 AI アプリケーションの構築と Amazon Bedrock との対話
  • AWS X-Ray と CloudWatch Logs を使用した Go アプリケーションの観測可能性
  • CDK、SAM、CloudFormation を使用したインフラプロビジョニングの自動化
  • キーパッケージ、Lambda カスタムランタイム、OpenTelemetry による計測

BOA205: Kubernetes のポッドの応答がない ! Kubernetes トラブルシューティングの旅

  • AWS Distro for OpenTelemetry のリリース。これにより Kubernetes アプリからのメトリクス、ログなどのパフォーマンスデータを AWS サービスの CloudWatch、X-Ray、Prometheus などにエクスポートできるようになった
  • CloudWatch Observable の新機能のリリース。これにより Fluent Bit などのツールをインストールし、手動設定不要で Kubernetes クラスタのログとメトリクスを取得できるようになった
  • kubectl、Stern、K9s などのツールを用いたイメージプル backoff、crashloopbackoff、OOMkilledpod などの共通的な Kubernetes エラーのトラブルシューティング方法のデモンストレーション
  • YAML マニフェストの複数の修正例に基づくアプリケーションデプロイメントのトラブルシューティング事例の説明。共通的な issue として資源の不足、プローブ設定、リソース制限などがある

BOA207: AWS の新サービス「インターネット接続性分析ツール」と VPC フローログ・トラフィックミラーリングを活用したネットワークトラブルシューティングのケーススタディ

  • AWS がネットワーク設定を分析し、リソース間の通信経路を特定して問題点を特定できる「インターネット接続性分析ツール」という新サービスを発表した。
  • ある企業が VPC フローログと VPC トラフィックミラーリングを使用することで、ネットワークトラブルシューティングを改善できたケーススタディが紹介された。トップ通信リソースを特定するためにネットワークトラフィックの可視性が向上した。

BOA208: 好きな曲のタイトルから AI がペットの名前を考案

  • アマゾンが提供する新サービス「 Bedrock 」を紹介。このサービスを利用することで、アマゾンの Titan モデル、AI21 ラボのモデル、Anthropic のモデル、Cohere のモデルなど、様々な基礎モデルを活用した創造的 AI アプリケーションの構築が可能になる。
  • Bedrock、Lambda、DynamoDB を利用して、曲名からペット名を生成する最小限のプルーフオブコンセプト (POC) ウェブアプリケーションの構築方法について説明。
  • DynamoDB との対話を生成するコードを自動生成するために Code Whisperer を活用するデモを実施。
  • プロンプト設計の重要性と、ペット名生成アプリで利用したプロンプトについて説明。
  • SAM を利用してアプリケーションのデプロイ方法と、Cognito を利用した認証などセキュリティ最良実践について説明。

BOA209: 40 分で実効性の高いアプリケーション認可を構築する

  • Amazon 認証済みポリシーサービス (Amazon verified permissions service) を紹介し、サービスとしてのポリシーベースの認可を提供した
  • サンプル書店アプリケーションに Amazon 認証済みポリシーと Cedar ポリシー言語を使用した認可の追加方法を実演した
  • ロールベースアクセスコントロール、属性ベースアクセスコントロール、コンテキストベースアクセスコントロールポリシーの例を示した
  • 認可ソリューションを選ぶ際の考慮事項として、使いやすさ、監査可能性、価格を議論した
  • Amazon 認証済みポリシーについて学ぶリソースとして、コードリポジトリ、CLI ツール、ワークショップ、ブログ記事を紹介した

BOA210: 生成型 AI と言語モデルの機能と応用方法

  • このセッションは生成型 AI と言語モデルについて紹介する
  • Transformer モデルを用いたテキスト生成の仕組みを説明する
  • CLIP、GPT-3、BERT などのファウンデーションモデルと、適切なモデルの選択方法について説明する
  • Amazon Bedrock コンソールを用いた大型言語モデルの利用方法をデモする
  • 温度、トップ -p、トップ -k などの技術を用いたテキスト生成のカスタマイズ方法について説明する
  • 追加的な文脈情報を提供するリトリーバ型生成 (RAG) について紹介する
  • API を用いたタスク実行能力を持つエージェントの構築方法について説明する
  • 知識ベースとエージェントを利用した生成型 AI モデルの簡易利用手段として Amazon Bedrock を紹介する

BOA303: Amazon SageMaker、Amazon CodeWhisperer を利用してデータから洞察を得る方法

  • Amazon SageMaker、Amazon Kendra、Amazon CodeWhisperer、Amazon Bedrock などの生成 AI サービスを利用してデータから洞察を得る方法が紹介された。
  • Amazon SageMaker と Kendra を使いインフレデータを各データソースから取得するデモと、Amazon Bedrock とベクトルデータベースを利用して Amazon Bedrock に関する関連パラグラフを表示するデモが披露された。
  • ファウンデーションモデルには限界があるが、Rag アプローチで外部データソースとモデルを結合することで問題を緩和できることが主張された。
  • データタイプと要件に基づき正しい利用事例を選択する重要性が強調された。カスタマイズデータは一般 AI アプリとカスタマイズ AI アプリを区別するキーとなる。

BOA304: AWS の AI サービスとサーバレスコンピューティングを利用した動画自動生成の紹介

  • 講師が Amazon Transcribe、Amazon Translate、Amazon Polly、AWS Step Functions などの AI サービスを使って、英語の動画をスペイン語に自動で吹き替えるアプリケーションを紹介した。
  • アプリケーションは手動レビューによる翻訳と吹き替え結果の検証を行い、品質を保証する。
  • AWS Step Functions を使い、吹き替えや動画アセット生成などのタスクを並列ワークフローでオーケストレーションできる。
  • Amazon S3、AWS Lambda、Amazon EventBridge などの AWS サービスを使い、イベント駆動型アーキテクチャを構築できることを紹介した。
  • AWS Step Functions、AWS Lambda、Amazon EventBridge、Amazon SQS などの AWS サービスを使い、非同期ワークフローや手動検証プロセスとの統合が可能。

BOA305: 音声・テキストから手話アニメへ :AI を活用した新たな手話アバターソリューション

  • 新しいジェスチャ言語であるアメリカ手話 (ASL) のアバター解決策「 GEN ASL 」を発表。これは音声やテキストを ASL のアニメーションビデオに変換する
  • Amazon Transcribe、Amazon SageMaker、Amazon Bedrock、テキストからビデオモデル、Anthropic の Claude モデルを利用
  • コーヒーショップで聴覚障害の人とプレゼンターとのコミュニケーション不足があり、それがこのソリューションの動機となった顧客事例
  • 音声入力を Amazon Transcribe でテキストに変換し、Amazon Bedrock と Anthropic の Claude で ASL グロスを生成、MMPost モデルで ASL アバタービデオを生成
  • 将来的には 3D アバター生成や ASL ビデオからテキストへの両方向変換を改善予定

BOA306: Amazon Bedrock を用いた AWS ソリューションアーキテクトエージェントの構築

  • Amazon Bedrock は生成型 AI を民主化し、顧客体験を AI エージェントによって変革できるよう開発者に力を与える
  • エージェントは、顧客が新しい体験を設計したりツールを構築したりするのに生成型 AI を活用する重要な応用事例
  • AWS ソリューションアーキテクトエージェントがデモンストレーションされ、コードの作成、Lambda ファンクションのデプロイ、図表の生成、ウェルアーキテクトフレームワークからの回答提供が可能

BOA307: - ライブデータと生成 AI を用いたアプリケーション開発

  • デモではカメラからのライブデータ入力を用いた生成 AI を使い、ストーリーと画像の生成を行った
  • Amazon Recognition、Amazon Bedrock、Claude V2、Stable Diffusion モデルを使用
  • 画像生成を並列処理するためにステップファンクションをオーケストレーションに使用
  • Party Rock はプロンプトエンジニアリングを始めるためのノーコードツールとしてアナウンスされた

BOA308: 生成型 AI のアーキテクチャとアプリケーションについてのセッション概要

  • セッションでは RAG( 回答追加生成)やエージェントなどの生成型 AI のアーキテクチャとアプリケーションについて議論された
  • Amazon Bedrock は基盤モデル、知識ベース、エージェントを扱うフルマネージドサービスとして紹介された
  • RAG の内部動作が例えば呪文とベクトルデータベースを使用したコード例でデモされた
  • 生成型 AI(RAG など)に関するセキュリティ考慮事項(ログ、監査、プライベートエンドポイント)が取り上げられた
  • アンケートではエージェントの構築と RAG を使用したカスタマイズソリューションの探求が多かった
  • 予測ではセキュリティ/ガバナンスの重視と生成型 AI による新規プロジェクトの開拓があるとされた

BOA309: AWS 上で分散型設計パターンを実装する

  • ユニコーンリテールという EC サイト運営企業がサイバーマンデーに 50% オフセールを実施し、予測できないアクセスに備える。
  • サイトが予測できないアクセスと新規のポイントサービスに対応できるようにする。
  • 域駆動設計でリテールとポイントのドメインを分離し運用性を高める。
  • リテールドメインでは AWS Step Functions を使いマルチステップチェックアウトプロセスを調整し一貫性を保つ。
  • ポイントドメインでは Lambda、DynamoDB、EventBridge などを使いポイントの集計と検索を柔軟に行う。
  • これによりポイント有効期限の柔軟な処理、高性能な読み書き分離、監査可能性が実現した。
  • S3、CloudFront、API Gateway、Lambda、DynamoDB、EventBridge、Step Functions などを使い分散型パターンでデプロイした。

BOA310: CDK と Kubernetes で IaaC の新時代ー RDS やキャッシュ、ウェブレイヤーを CDK で作成し Kubernetes クラスターにデプロイ

  • Kubernetes クラスター内で AWS リソースを管理できるツールの CDK8s について説明した。

  • デモでは RDS のデータベース、キャッシュレイヤー、ウェブレイヤーを CDK で作成し、Kubernetes クラスターにデプロイした。

  • Code Whisperer はコードの提案を自動で行い、セキュリティや OSS コードのチェックも行う。

  • アプリケーションのスケールアウトは HPA(Horizontal Pod Autoscaler) を使用することで実装できる。

BOA311: AWS Lambda Web Adapter でサーバーレス Web アプリケーションの構築と移行を大幅なコード変更なしに可能にする

  • AWS Lambda Web Adapter を使うと、大幅なコード変更なしにサーバーレス Web アプリケーションの移行や構築が可能になる
  • AWSLambda Web Adapter は Web アプリケーションと Lambda のプログラミングモデルの間のブリッジとなる
  • 開発者は熟知したフレームワークやツールを使って Web アプリケーションの構築と Lambda へのデプロイができる
  • ローカル開発とデバッグがサポートされ、Web アプリケーションのローカル実行が可能
  • Docker イメージとして Web アプリケーションをパッケージ化し、コード変更なしに Lambda にデプロイできる
  • 応答ストリーミングをサポートするために Lambda ランタイムが強化

BOA312: 機械学習とベクトルデータベースを利用した高度な AI 検索

  • Amazon Aurora の PostgreSQL 拡張機能である PG Vector を利用して、機械学習や生成 AI モデルを使ってスマートなアプリケーションの構築を紹介した
  • ドキュメント、画像、音声などのデータをベクトル埋め込みとしてベクターデータベースに格納し、コサイン類似度、ユークリッド距離、内積などの技術を使ってセマンティックサーチを実行する方法を示した
  • Amazon Lexicon を使って要約を行い、求人要件に基づいてベクターデータベースから類似のリズミ埋め込みを検索し、ショートリストしたリズミの要約をデモした

BOA320: Redis と Amazon MemoryDB を活用したリアルタイムゲームアプリの構築

  • アマゾンが Redis 向けの完全管理型インメモリデータベースサービス「 Amazon MemoryDB for Redis 」を発表。高性能・スケーラビリティを提供し、リアルタイムゲーミングアプリやエンタープライズアプリの構築を支援。
  • デモでは Redis と Amazon MemoryDB を活用したクイズゲームを紹介。参加者がリアルタイムで問題に答え、ライブでリーダーボードを更新できる。
  • 生成 AI を NPC に活用し、ゲーム環境データから AI モデルにコンテキストデータを提供。より自然で人間らしい対話を実現。
  • Amazon MemoryDB はマルチ AZ のトランザクションログで書き込みを複製。障害からの回復性を実現。

BSI101: アマゾンの BI ツール QuickSight に AI を活用した機能が強化、自動生成機能や自然言語対応で分析効率アップ

  • アマゾンの BI サービスである QuickSight に AI を利用した機能が追加された。ダッシュボードの自動生成、自然言語での質問に対する回答、データからのストーリーテリングが AI により支援される。
  • ビジネスアナリストは自然言語でダッシュボードを作成できるため作成が高速化される。
  • ビジネスユーザーは自然言語で質問し、簡単に洞察を得られる。
  • ビジネスユーザーは AI を利用しデータを分析して洞察から説明するストーリーを作成できる。
  • ゴダディは顧客サポートアナリストなどのチームで QuickSight を利用し、洞察に至る時間を短縮している。
  • ゴダディは QuickSight からの洞察により、起業家を支援する目標を持つ。
  • ハーロンは QuickSight の埋め込みレポートと定期レポートを利用し、顧客に統合されたデータ体験を提供している。

BSI203: Amazon QuickSight の組み込みアナリティクスを活用したアプリケーションの強化

  • Amazon QuickSight では、開発者がアプリケーションにビジュアライゼーション、ダッシュボード、機械学習による自然言語クエリをエンベッドして大規模に展開できるように、組み込みアナリティクスが導入されました。インフラを管理する必要はありません。
  • 物流管理会社の Extensiv では、倉庫マネジャーが各顧客毎の労働生産性と利益性についての洞察を提供するために、QuickSight のダッシュボードとビジュアライゼーションを組み込みました。
  • Honeywell は、ライフサイエンス顧客にマルチテナントのアナリティクスダッシュボードを提供する一方で、コンプライアンスとセキュリティを保証するために、Connected Licences 部門に QuickSight を組み込みました。

BSI204: Amazon QuickSight によるビジネスレポーティングの近代化 - マルチページ PDF レポートの生成機能強化と自動レポート配信のケーススタディ

  • Amazon QuickSight が新しいページェントレポーティング機能を導入し、高度にフォーマットされた複数ページ PDF レポートを生成できるようになった
  • 主な機能には紙サイズ/向きの選択、マージンのカスタマイズ、ページ番号/ヘッダ/フッタの追加が含まれる
  • 新機能としては、高度なスケジューリングオプション、次元値毎の個別ページ作成が可能なリピーティングセクション、プロンプト値適用可能なプロンプトレポートが発表された
  • Topgolf ケーススタディでは、他の BI ツールから QuickSight に 100 件超のレポートとダッシュボードを移行し、統一された作成と利用体験から利点が得られたことが説明された
  • Topgolf はまた、ページェントレポートとスケジューリング機能を活用し、様々なフォーマットのレポートを自動で各施設に配信している
  • 3M Health Information Systems ケーススタディでは、スナップショットエクスポート API を活用して、顧客向けパフォーマンスレポートを大規模に自動生成し、手動 PDF 作成を排除できたことが説明された

BSI205: - アマゾンクイックサイトは AI 支援の機能が強化、自然言語に対応したダッシュボード作成が可能に

  • アマゾンクイックサイトは、自然言語を使用したダッシュボードや視覚化の構築など、AI 支援の生成型オーソリングとストーリーテリング体験を備えるようになりました。
  • クイックサイトは埋め込みアプリケーションとの統合が強化され、リッチな視覚化が可能になりました。
  • クイックサイトは、アマゾン IAM(Identity and Access Management) と統合されたセントラライズされたアイデンティティ管理を備えるようになりました。
  • クイックサイトは、Amazon SageMaker Canvas で構築された機械学習モデルと統合できるようになりました。
  • クイックサイトは、SageMaker Canvas で構築された機械学習モデルからの予測フィールドをサポートするようになりました。

BSI206: - Amazon QuickSight を使用して企業内 BI を安全にスケール可能にする

  • QuickSight はダッシュボード、レポート、自然言語型問い合わせ (NLQ) 機能を1つのツールで統合したビジネスインテリジェンス (BI) を全ユーザー向けに導入した
  • QuickSight は Spice キャパシティのオートパーチェス機能を追加し、必要なキャパシティは自動的に拡張できるようになった
  • QuickSight は回答の要約と後で利用可能な回答のピン留め機能を追加することで、質問応答体験を向上させた
  • QuickSight はエンドユーザーがデータストーリーを伝え、カスタマイズ可能なプレゼンテーションを通じてインサイトを提示できるストーリーテリング機能を導入した
  • QuickSight は Amazon SageMaker Canvas を統合し、QuickSight 内からビジネスユーザーが機械学習モデルを構築・運用できるようになった

BSI207: Amazon QuickSight を使用した AWS のコスト報告のインタラクティブなダッシュボード

  • AWS は新しいコストと使用状況のダッシュボードを発表しました。このダッシュボードは Amazon QuickSight で動作し、AWS の課金とコスト管理コンソールから直接設定できます。
  • このダッシュボードは、AWS サービス、アカウント、リージョンなどの Daily 単位でのコストと使用状況に関するデフォルトのインサイトを提供します。
  • このダッシュボードをコピーして、追加の視覚化、データソース、セキュリティ設定をカスタマイズできます。
  • QuickSight はコストデータの分析と視覚化、他のデータソースの統合、組織内でのインサイトのセキュアな共有を可能にします。

BWP301: 「 Buy with Prime 」のマイクロサービスアーキテクチャとマルチテナンシー対応

  • プライム会員はトラステッドな Amazon の体験(無料迅速な配送、スムーズな決済、簡単な返品)を活用してオンラインストアの直接買い物が可能になる「 Buy with Prime 」機能は数百万人のプライム会員に利用されている
    -「 Buy with Prime 」ボタンは JavaScript スニペットや Shopify アプリを使って商店のウェブサイトに統合できる
  • プライムデー前月と比較して、「 Buy with Prime 」は平均 25% のショッパー転換率増加と1日 10 倍の注文数増加、1日8倍の売上増加を実現
    -「 Buy with Prime 」は開発効率と機能向上を目的にマイクロサービスアーキテクチャを採用
    -「 Buy with Prime 」はマルチテナンシー隔離のためにテナント ID でデータやリクエストをタグ付け
  • テナンス隔離の自動検証は開発パイプラインのセキュリティ統合テストで実施
  • CloudFormation を使って商店連携用のリソースをマイクロサービス間で設定
  • 異なるチームで開発されたマイクロサービス間でメトリクス収集、ロギング、モニタリングを標準化するために CDK を利用

BWP302: AWS CDK を利用したインフラストラクチャの構築

  • プライム会員はマーチャントストアでも Amazon と同じ信頼できる体験ができる「 Buy with Prime 」で、プライマーのショッパーのコンバージョン率は平均 25% 上昇
  • 「 Buy with Prime 」は Amazon のフルフィルメントネットワークを活用し、マーチャントにとって迅速な無料配送を提供
  • 「 Buy with Prime 」は AWS CDK を利用し、クラウド戦略の迅速なスケールとサービスのセキュアかつ拡張可能なデプロイを実現
  • 「 Buy with Prime 」はインフラストラクチャのプロビジョニング用再利用可能なコンストラクトを構築するために CDK のクロスファンクショナルチームを設立

BWP303: Amazon Bedrock と Buy with Prime API を活用したショッピングアシスタントの概念検証

  • Amazon Bedrock と Buy with Prime API を利用したショッピングアシスタントの概念を実証
  • Amazon Bedrock は生成 AI 機能を提供し、生成 AI アプリケーションの構築とスケールアップを管理するエージェントサービスを提供
  • Buy with Prime API を利用して製品管理、製品メタデータのカスタマイズ、実時間に近い更新を維持し、システム間連携を容易にする
  • デモアシスタントは Amazon Bedrock エージェントを利用し、顧客との会話をオーケストレーションし、会話内容に基づいて Buy with Prime API の呼び出しなどのアクションを実行
  • アシスタントが製品検索、詳細情報・レビュー参照を通じて、顧客質問に答える方法を示した

CEN102: 銀行の顧客体験の再構築―― Amazon Connect と AWS を活用した大手米国銀行の事例

  • 米国の大手銀行は顧客エンジェームントのオムニチャネルプラットフォームとして Amazon Connect を選択した
  • 50 以上の事業部門で 10,000 人以上のエージェントを Amazon Connect に移行
  • 銀行の 600 万人の顧客を対象に Amazon Lex を使った仮想エージェントを構築
  • デジタルセルフサービス、コールバック機能、オムニチャネルメッセージング、AWS 上の統一アーキテクチャなどの機能を搭載
  • エージェントの生産性向上と Launch 時の重大な問題なしで移行が成功した

CEN201: 顧客満足度向上を事業戦略に組み込み、テクノロジーとデータ利用でビジネス目的を達成する方法について議論したパネル

  • 顧客満足度向上を事業戦略に組み込み、テクノロジーを活用してビジネス目的を達成し顧客価値を向上させる方法について議論した
  • Score は AI と機械学習モデルを利用し、複数のデータソースから生命保険申請者を1分以内に評価する
  • Rockwell Automation はクラウドチームと提携する一方で物理インフラも保有し、クラウド移行とクラウド利用を両立させる
  • Ion はビジネスとテクノロジーのステークホルダーを集めた共同イノベーションポッドを設けることで、顧客満足度向上を支援する
  • AI 利用事例として、コンプライアンスマッピング、クレーム管理、カスタマーサービス向上が議論された
  • 顧客満足度向上にはデータが不可欠だが、責任ある利用とデータ主権も考慮する必要がある
  • テクノロジー以上に目的重視、従業員の権限委譲、安全な失敗を許容することでイノベーションが推進される

CEN401: - シティズンズ銀行は HELOC 申請期間を 80% 短縮。クラウド、AI、データ分析活用の「 Fast Line 」サービスを発表

  • シティズンズ銀行は HELOC( 住宅担保ローン)の申請期間を 80% 短縮するためにクラウド、AI、データ分析を活用した「 Fast Line 」サービスを発表した
  • シティズンズ銀行は 2026 年までに全データセンター運用を終了し、100% クラウドファーストな組織へ移行する目標
  • BP は年間 35 兆ドル相当の取引を処理するウォール街トレジャリーマネジメントシステムをクラウドに移行し改修
  • BP は 2030 年までに AI 分野でセクターリーダーとなること、エネルギー産業におけるイノベーションの必要不可欠な技術と位置付けている

CMP102: Amazon EC2 の新機能とサービスアップデート

  • AWS Nitro システムが導入され、ハードウェアと管理機能が分離され、ベアメタル並みのパフォーマンスが実現され、新規インスタンスの起動が高速化された
  • 新しい Intel 7th Generation Xeon Scalable プロセッサ (Sapphire Rapids) が導入され、他のクラウドサービスより 15% 性能が向上した
  • 新しい AMD 7th Generation Epyc Genoa CPU が導入され、前世代比 50% 性能向上した
  • 新しい AWS Graviton3 プロセッサと Graviton4 が導入され、最大 50% コア数増加とマルチソケットコヒーレンシーが初めて実現された
  • 新しい AWS Trainium 2 チップが導入され、前世代比機械学習訓練性能が 14 倍向上した
  • 新しい AWS Inferentia 2 チップが導入され、機械学習推論スループット4倍、レイテンシ 10 倍低減した
  • NVIDIA GPU サポート拡大で新しい H100、L40、H200 GPU と Grace Hopper ベースの DGX Cloud、Project Sienna スーパーコンピュータ導入が発表された

CMP104: AMD EPYC Genoa プロセッサ搭載の新世代 EC2 インスタンス発表 - 最高2倍の性能向上と最大 37% のコスト削減

  • AMD は、AMD EPYC Genoa プロセッサを搭載した新しい7世代の EC2 インスタンス (M7A、R7A、C7A、HPC7A) を発表した
  • 7 世代の AMD インスタンスは、前世代比で最高2倍の性能向上を提供
  • 高性能化により、インフラコストを最大 37% 削減できるインスタンス数を少なくできる
  • 顧客 Aiona 社は、M7A インスタンスを使用して、電力網シミュレーションの速度を 59% 向上
  • 顧客フェラーリ社は、HPC7A インスタンスを使用して、CFD シミュレーションの性能を 30% 向上

CMP105: AWS EC2 の新機能「 Capacity Blocks 」により、機械学習ワークロード用の GPU リソースを予約可能に

  • AWS EC2 の ML 用新規予約オプション「 Capacity Blocks 」がリリースされ、米国イースト(オハイオ)リージョンの P5 インスタンス (NVIDIA H100 GPU 搭載)の GPU リソースを機械学習ワークロード用に予約可能に
  • Capacity Blocks では他のオプションに比べ短期 (1 日 ~) の予約も可能で、需要時の動的価格設定でスポット価格以下の場合も
  • Leonardo AI は Capacity Blocks で柔軟に適切なインスタンスを使用でき、未使用容量を保持しない利点があるとコメント
  • Capacity Blocks では予約期間中自動スケール可能な EKS クラスターと連携可能

CMP201: AWS インフラストラクチャが推進する生成型 AI ブーム

  • AWS は新しい管理型 AI サービスとして Amazon SageMaker Studio、Amazon SageMaker Canvas、Amazon SageMaker Data Wrangler、Amazon SageMaker Model Monitor、Amazon SageMaker Clarify をリリースしました。
  • Adobe は EC2、EBS、EFA、S3、Luster などの AWS インフラを利用して、Firefly のような生成型 AI モデルの訓練と配備を行っています。AWS の計算能力を 20 倍増強し、テラフロップあたりのコストを 3~4 倍削減しました。
  • Amazon は製品ページから得た多様なデータを利用して、EC サイト関連エンティティの意味表現を訓練しています。スペリング修正、AI 生成製品画像、ビデオリコメンドなどの AI アプリケーションを開発しました。
  • Adobe と Amazon は、性能向上とコスト削減のために、GPU、Trainium、Inferentia などの AWS アクセラレータ向けにモデルとコードの最適化を行っています。混合精度、分散訓練、アクセラレータ間のチェックポイント互換性などの技術を利用しています。

CMP202: AWS EC2 のブロックストレージの選択肢として、ローカルインスタンスストアと Amazon EBS があります。ローカルインスタンスストアのデータはインスタンスの寿命中は維持されますが、停止/終了時には維持されません。Iファミリーのストレージオプティマイズドインスタンスは、ストレージインテンシブなワークロードに最適化されています。Amazon EBS ボリュームはインスタンスの寿命から独立しており、スナップショットやエラスティックボリュームなどの機能に対応しています。Cox オートモーティブは、EBS IO2 ボリュームと自動化を使用して、Oracle データベースを実行し、性能が向上しました。オンライン小売業者は、EBS GP3 ボリュームを使用して、ストレージをオンラインでスケールでき、ダウンタイムなく柔軟性がありました。

  • AWS EC2 では、ローカルインスタンスストアと Amazon EBS を含む、ブロックストレージの複数の選択肢があります。
  • ローカルインスタンスストアのデータは、インスタンスの寿命中は維持されますが、停止/終了時には維持されません。
  • I ファミリーのストレージオプティマイズドインスタンスは、数百万 IOPS と低遅延でストレージインテンシブなワークロードに最適化されています。
  • Amazon EBS ボリュームは、インスタンスの寿命から独立しており、スナップショットやエラスティックボリュームなどの機能に対応しています。
  • Cox オートモーティブは、EBS IO2 ボリュームと自動化を使用して、Oracle データベースを実行し、性能が向上しました。
  • オンライン小売業者は、EBS GP3 ボリュームを使用して、ストレージをオンラインでスケールでき、ダウンタイムなく柔軟性がありました。

CMP206: アマゾンにおける生成 AI のインフラの内部事情:新型機械学習チップの開発と大規模クラスタ構築、DataBricks による低コストモデル構築とスポーツチーム向けカスタム AI

  • AWS は新しい機械学習チップ「 Trainium 2 」を開発中で、Trainium 1 よりも4倍の性能がある
  • AWS は Trainium 2 を使用した 10 万チップクラスタを構築し、65 エクサ FLOPS の計算能力を提供
  • DataBricks は Trainium を使用して Stable Diffusion のような生成 AI モデルをよりコスト効率的に構築
  • DataBricks は Trainium でテキサス・レンジャーズ野球チーム向けのカスタム AI モデルを訓練し、ワールドシリーズ制覇に貢献

CMP207: - AWS EC2 キャパシティブロック:機械学習トレーニングや実験などのワークロード用に、GPU キャパシティをジョブ単位で予約できる新しい EC2 購入オプション。ML プロジェクトのキャパシティの予約可用性に合わせた計画が可能。

  • アマゾン EC2 キャパシティブロック :ML トレーニングや実験などのワークロード用に、GPU キャパシティをジョブ単位で予約できる新しい EC2 購入オプション。ML プロジェクトのキャパシティの予約可用性に合わせた計画が可能。
  • セールスフォースのケーススタディ:キャパシティ予約、セービングプラン、スポットインスタンスをワークロード特性に合わせて組み合わせる戦略で、毎月 100 万ドルのコスト削減。AWS 移行時のキャパシティと可用性が向上。

CMP208: AWS と NVIDIA の最新 AI 技術 - AWS は NVIDIA の H100 GPU を搭載した新型 EC2 インスタンス P5 を発表。Adobe や自動運転会社は AI 訓練で活用予定

  • AWS は NVIDIA の H100 GPU を搭載した EC2 P5 インスタンスを発表。GPU メモリ 80GB、FP16 性能 8,000TFLOPS
  • EC2 Ultra Clusters は 20,000GPU スケールアップ。ネットワークレイテンシも低減
  • EC2 Capacity Blocks で将来の EC2 P5 容量を予約可能に。GPU アクセス保証
  • Adobe の Firefly は EC2 P4/P5/G5 で訓練モデルで 40 億枚画像生成
  • 自動運転会社は EC2 P4/G5/G4 で機械学習シミュレーション
  • Pinterest は EC2 P4/G5/Ultra Clusters で 1GPU~1 万 GPU の訓練ジョブ実行
  • Pinterest は EC2 G4/G5/P4 で分散アーキテクチャで毎秒数百万件インファレンス

CMP209: 「生成 AI の活用:ハイプを超えて実用化の価値を追求する」

  • 生成 AI は、顧客体験の改善、業務の効率化、新たなビジネスモデルの創出など、企業に AI がもたらす可能性に注目させている
  • 生成 AI アプリケーションの成功要因は、適切なユースケースの選定、モデルの選定、ML オペレーションの管理、ML インフラの最適化など様々な要因に依存する
  • AWS re:Invent については https://go.aws/46iuzGv をご覧いただきたい

CMP211: - AWS が提供する EC2 インスタンスの種類と価格設定を活用し、コンピューティングコストを最適化する戦略について

  • AWS が、Graviton4 と呼ばれる次世代 Graviton CPU アーキテクチャを発表し、Graviton3 に比べ CPU 性能が 30% 向上し、コア数が 50% 増加、メモリ容量が 75% 増加した
  • フライト検索エンジン Skyscanner が、自社データセンターから AWS へ移行し、サービス起動時間を 6~7 週間から 15 分に、運用コストを最大 70% 削減、柔軟性とスケーラビリティを向上した
  • AWS のコンピュートセービングプランはオンデマンド価格に比べ 66% の割引を提供し、リージョンやインスタンスファミリ、サイズに柔軟に対応する
  • スポットインスタンスは EC2 の余剰容量を深刻な割引価格で利用できるが、アプリケーションが障害に強健で動的に中断されたインスタンスを自動的に置き換えられる必要がある
  • Carpenter は AWS が開発した Kubernetes クラスター自動スケーラーおよびスケジューラで、クラスターを自動的にスケールし、適切なインスタンスサイズに最適化し、スポット価格を活用し、ノードを集約することでコンピュートコストを最適化する

CMP212: AWS の新型 Graviton 4 プロセッサと ARM アーキテクチャによるコストと CO2 削減、AWS の最適化ツールを紹介

  • AWS は Graviton 4 プロセッサを発表し、Graviton 3 に比べて最大 30% 高性能になるとしている
  • Adobe はリアルタイム入札プラットフォームの作業量の 73% を x86 から Graviton ARM インスタンスに移行し、EC2 使用量を 23% 削減し、20-30% のコスト削減、1CPU あたり 17% 増の入札、CO2 排出量 41% 削減を達成
  • AWS コンピュート・オプティマイザは機械学習を使用し、継続的なインスタンスの適正規模推奨を提供してコスト最適化を目指す
  • EC2 Spot プレイスメントスコアトラッカー、属性に基づくインスタンスタイプ選択、EC2 柔軟性ダッシュボードなど新しい AWS サービスと機能が紹介された

CMP213: AWS が新たに HPC 向けインスタンスファミリーを発表、某自動車メーカーが一部の HPC ワークロードを AWS クラウドに移行し、コア数を倍増させることでオンプレミスより高いパフォーマンスが得られたこと、HPC リソースへのアクセスと管理の新サービス「 Research and Engineering Studio(RES) 」を発表したことを紹介しています。

  • AWS は HPC ワークロードに最適化した新しい HPC インスタンスファミリ (HPC6id、HPC7a、HPC7g) を発表
  • フェラーリは柔軟性、スケーラビリティ、最新のコンピューティングテクノロジーへのアクセスを理由に一部の HPC ワークロードを AWS クラウドに移行
  • フェラーリは AWS クラウドでコンピュートコア数を2倍に増やすことで、オンプレミス設定よりも最高 60% 高いパフォーマンスが得られた
  • AWS は HPC リソースへのアクセスと管理のポータルとなる新サービス「 Research and Engineering Studio(RES) 」を発表

CMP214: AWS を利用した半導体・バイオテクノロジー分野における HPC サービス

  • アストラゼネカは、シークエンスデータを処理し発見を導くためのゲノムパイプラインと分析機能をペタバイト規模で構築するために、AWS Batch、AWS Parallel Cluster、AWS Step Functions、AWS Lambda、S3、DynamoDB などの AWS サービスを利用している
  • ARM はチップ設計と EDA ワークロードを AWS Graviton インスタンスで実行し、計算ワークロードの 73% を AWS クラウドに移行した。これにより汎用性が向上し効率化が図れ、イノベーションが加速される
  • AWS は過去数年間で HPC7A、HPC7G、HPC6id など新しいインスタンスタイプを含め HPC とアクセラレータコンピューティングサービスを継続的に革新している

CMP218: AWS の EC2 Mac インスタンスを活用したドロップボックスの Mac アプリ開発効率化とコスト削減

  • 2020 年、AWS は EC2 Mac インスタンスの提供を開始し、クラウド上で初めて MacOS 環境へのオンデマンドアクセスを可能とした
  • EC2 Mac インスタンスは、各 Mac インスタンスに専用の CPU、ストレージ、ネットワークリソースを提供する AWS Nitro システムを利用する
  • ドロップボックスは、社内 Mac インフラストラクチャを EC2 Mac インスタンスに置き換え、クラウド上で Mac 開発ワークロードをスケールできるようにした
  • EC2 Mac インスタンスは、スケーラビリティ、エラスティシティ、他の AWS サービスとの統合により、ドロップボックスの Mac 開発効率向上とコスト削減を実現した

CMP222: Amazon EC2 の新しい AI 機能 - Amazon Q を利用した EC2 インスタンスの選択支援とコンソールからコードの自動生成、ネットワークトラブルシューティング支援

  • Amazon Q では、自然言語でのクエリで EC2 インスタンスを即座に選択できるようになり、ワークロード要件に基づいて選択できる
  • Console to Code 機能では、AWS Management Console でのアクションから CDK や CloudFormation のコードスニペットを生成し、プロトタイプを本番導入できるようにする
  • Amazon Q for network troubleshooting では、平文の質問でネットワーク接続の問題をトラブルシューティングでき、可能な原因と問題を解決するための手順を提案してくれる

CMP306: AWS の Nitro システムについて深く掘り下げる

  • AWS は4世代目の Graviton チップと2世代目の機械学習トレーニングチップ Trainum 2 を発表した
  • Nitro システムはネットワーク、ストレージ、セキュリティなどの機能を専用の Nitro カードにオフロードすることでベアメタル並みの性能を提供する
  • Nitro カードはシングルルート I/O 仮想化 (SR-IOV) と Scalable Reliable Datagram(SRD) を提供し、ネットワーク性能を向上する
  • Nitro カードはフラッシュ変換レイヤ (FTL) を統合し、一貫したローカル SSD パフォーマンスを提供する
  • Nitro システムはセキュアブート、Trusted Platform Module(TPM)、イミュータブルファームウェアなどのセキュリティ機能を導入しセキュリティを強化
  • 2017 年以降、Nitro によって稼働するインスタンスタイプが 600 種類を超え、イノベーションのペースを速めている
  • AWS は Nitro システムに関する新しい AWS コンピュートデジタルバッジとラーニングパスを発表した

CMP307: AWS Nitro Enclaves を利用した機密データの保護

  • AWS Nitro システムは、デフォルトで AWS オペレーターから顧客データを保護します(次元1の保護)
  • AWS Nitro Enclaves は、インスタンス内の管理者や悪意のあるアクターからデータをさらに分離して保護します(次元2の保護)
  • Stripe は、支払処理サービスに必要な暗号化キーの securely storage と管理のために Nitro Enclaves を利用しています
  • Nitro Enclaves の人気の利用事例は暗号化操作、機械学習モデル、ターゲティング広告、マルチパーティコラボレーション、ブロックチェーンワークロードなどです

CMP309: AWS の新しい EC2 インスタンスのリリースで、最大 30% の性能向上がある

  • AWS が Graviton3、Sapphire Rapids、Genoa ベースの EC2 インスタンスをリリースし、最大 30% の性能向上がある
  • 新しいインスタンスには DDR5 メモリ、最大 50Gbps のネットワーク帯域幅、最大 100Gbps の EBS 帯域幅などの機能がサポートされる
  • Salesforce は M7 インスタンスで M6 インスタンスに比べ最大 25% 高いスループットと 11% 速い応答時間がある
  • Netflix は AMD ベースのインスタンスで前世代より 40% 高いスループットと 50% 低いレイテンシーがある
  • NASDAQ、Total、フェラーリなどの顧客は新しい EC2 インスタンスを活用し、業務アプリケーションの性能向上が見られた

CMP313: AWS Graviton4 プロセッサの新機能と R8g インスタンスのプレビュー、メモリ集約型ワークロード向けの性能向上効果

  • Graviton4 は 2023 年の re:Invent で発表された最新の Graviton プロセッサで、最大 30% 高い演算性能と最大3倍の vCPU とメモリを持つより大型のインスタンスサイズを提供する
  • Graviton4 はメモリ集約型ワークロード向けの新しいプレビュー中の R8g インスタンスを動かす
  • Datadog、Epic Games、Honeycomb は R8g インスタンスをテストしたところ最大 25-30% の即時性能向上を確認
  • Pinterest は Graviton3 に移行しメモリ集約型サービスを最適化することで最大 40% のコスト削減と最大 30% の CPU 使用率削減効果を確認し、Graviton4 の初期テストでも同様の効果が見られた
  • Amazon は Graviton で SAP HANA Cloud を動作させ最大 35% 良い価格性能を実現できると発表

CMP315: AWS Graviton への重要なビジネスアプリケーションの移行― SAP Hana Cloud の事例

  • SAP Hana Cloud は、パフォーマンス改善、価格パフォーマンス面での利点、持続可能性・エネルギー効率向上の効果を得られると考え、AWS Graviton に移植された。
  • 移植プロジェクトでは、継続的インテグレーション/デリバリパイプラインの適応、250 超のマイクロサービスの移植、AWS Graviton 向けのデータベースエンジンの適応が含まれた。
  • データベースエンジンの初期移植は6ヶ月で完了し、後続して選択されたマイクロサービスと CI/CD パイプラインが移植された。
  • パフォーマンステストでは、分析的ワークロードでは Graviton 上で最大 50% の改善が見られたが、取引ワークロードでは初期は上回らなかった。
  • SAP Hana Cloud では、Graviton 上で約 35% の価格パフォーマンス改善と 45% のカーボンフットプリント削減が見込まれた。
  • 取引ワークロードのパフォーマンスも、Graviton 4 アーキテクチャのプリフェッチアルゴリズムの改善により、今後上昇が期待される。

CMP334: AWS が新型 Graviton プロセッサ「 Graviton 四世代」を発表 - 性能が最大 30% 向上し、メモリ利用が多いワークロード向け新インスタンス R8g を提供開始

  • AWS は最新の第4世代 Graviton プロセッサ「 Graviton four 」を発表した
  • Graviton four は前世代の Graviton three よりも最大 30% 性能が向上し、vCPU とメモリは最大3倍に増強
  • 最初に Graviton four を搭載したインスタンスは R8g で、メモリ利用が多いワークロード向けの価格性能が最良
  • R8g インスタンスは現在プレビュー提供中で、プレビュー参加申し込み可能
  • Snowflake、Adobe、ARM などは Graviton 移行後、大幅な性能向上とカーボン排出削減効果を実感
  • データベース会社 SAP は SAP HANA Cloud が Graviton 対応し、最大 35% の価格性能向上と 45% のコンピュートカーボンフットプリント削減を実現

CMP336: 「 Amazon Linux 2023 - 5 年間サポート、パッケージ数削減と SELinux サポート強化」

  • 2023 年3月にリリースされた Amazon Linux 2023 は5年間のサポート期間を持つ
  • Amazon Linux 2023 の主な機能はパッケージ数の削減、SELinux サポート、カーネル強化の改善、ライブカーネルパッチング
  • Amazon Linux 2023 ではバージョンレポジトリ/決定的な更新機能が導入され、更新サイクルの予測可能性と計画性を実現

CMP404: AWS Graviton へのコンテナサービス移行

  • AWS は Graviton 4 を発表し、これは Graviton 3 より最大 30% 高速になる
  • サムスンはモバイル TV サービスを x86 アーキテクチャから AWS EKS 上の Graviton アーキテクチャに移行し、コスト削減と性能向上を実現
  • マルチアーキテクチャコンテナイメージを構築することで、x86 と Graviton の両方でデプロイ可能
  • AWS Fargate を利用することで、アーム 64 ランタイムを指定するだけで Graviton へのデプロイが簡単に行える
  • Karpenter のようなツールでは、EKS クラスタのポッド要件に基づいて Graviton ノードをプロビジョニング可能

COM201: 60 分でクラウド上で AI ゲームを構築!エモジから本や映画を当てる新ゲーム「 Emoji us 」

-「 Emoji us 」という新しいゲームサービスが発表された。このゲームでは、ユーザーがエモジ集合から有名な本や映画を当てる。

  • このゲームは、AI アプリケーションの構築方法をデモンストレーションするために 60 分で構築された。
  • 有名な本や映画のエモジサマリーは、AWS Bedrock 上でホストされている Amazon Titan モデルで生成された。
  • 埋め込みモデルは、元の入力と予測との間の意味的類似性に基づいて予測をスコア付けした。

COM202: AWS を利用した AI コミックビデオジェネレーターサービス「 Ali 」の開発事例

  • 新しい AI コミックビデオジェネレーターサービス「 Ali 」が発表された。このサービスは、ストーリータイトルと写真数枚を入力すると、音楽と音声ナレーション付きでコミックビデオを生成できる。
  • Ali は、Amazon SageMaker、Amazon Polly などの AWS サービスを利用して、AI モデルによるストーリースクリプトのジェネレーション、Stable Diffusion による画像生成、音声ナレーションの生成、コミックビデオとしての編集を行うことができる。
  • このサービスは、息子のために要求されたときに、息子のおもちゃをキャラクターとしたパーソナライズされたベッドタイムストーリーを生成できるように開発された。
  • イメージモデルによるキャラクターの一貫性のなさは、キャラクターの写真を用いた Stable Diffusion のファインチューニングにより解決された。

COM203: AWS の生成 AI を用いたポテンシャルの解放

  • 生成 AI モデルである Stable Diffusion をテキストから画像を生成する技術などを用いて、少量のデータでファインタニングすることでドメイン固有の概念を理解できるように特化できることをデモンストレーションした。
  • 講師は AWS の重役ジェフ・バーの9枚の写真から 15 エポック学習し、モデルをファインタニングすることで、ジェフ・バーのリアルな画像をテキストプロンプトに基づいて生成できるようになった。

COM204: Apache ShardingSphere を用いた Kubernetes 上での Aurora データベースの分散とトラフィック管理

  • アパッチ ShardingSphere は、オンプレミス環境や Kubernetes 璭境内で、データシャーディング、読み書き分割、クエリトラフィック管理を自動化できる
  • 適応的なデプロイアーキテクチャにより、アプリケーションはどこでもデータベースサービスを効果的に利用でき、低遅延、高トラフィック、可用性が向上
  • 発表者は、シングル RDS インスタンスから分散データベースへのアップグレードが必要となった実例事例を紹介した
  • 発表者は、Apache ShardingSphere のプロキシ(計算ノード)を Kubernetes にデプロイし、アプリケーションにステートレスなデータベースサービスを提供し、既存の RDS インスタンスをストレージノードとして利用するソリューションを提案
  • この仕組みで、最小限のデータ移行で既存データベースを分散データベースにアップグレードできる
  • Apache ShardingSphere のプロキシは、負荷分散、データシャーディング、クエリルーティング、性能向上を行う
  • ロードテストでは、分散ソリューションはシングル RDS インスタンスに比べ TPS を 505-1118% 向上、レイテンシを 19% 低減できた

COM301-R: Amazon EventBridge を使用したイベント駆動パターンの最新事例

  • 来年早期発売予定のサーバーレスアーキテクチャに関する共著書の新規発表を行った
  • イベント駆動アーキテクチャの基礎とイベントブリッジがイベントバスとしてどのように位置づけられるかを説明した
  • Choreography、Orchestration、AWS のネイティブなインテグレーションを使用した Functionless インテグレーションなど、一般的なイベント駆動パターンを見た
  • イベントの構成と異なるタイプのイベントに関するベストプラクティスについて議論した
  • 顧客登録や第三者アプリケーション統合でイベントブリッジを使用したケーススタディをプレゼンテーションした

COM302: AWS CDK を4年間使用した経験から学んだ教訓 - マルチリージョンデプロイ、CDK コードの構成、CDK パイプラインの定義、外部データの取得方法、CDK コードのテスト方法など

  • AWS CDK は 2019 年7月のリリース以来、AWS 上で複雑なシステムを構築するための強力なインフラストラクチャー・アズ・コードツールとなっている
  • 最後の4年間に AWS CDK で開発されたベストプラクティス、パターン、ワークフローを学ぶ
  • ベーシックな ECS ベースのウェブサイトを構築し、米国東部1地域と米国西部2地域にデプロイするマルチリージョン例を示した。サーバレスベースのメディアトランスコーダも含まれる
  • CDK コードをソースディレクトリ、コンストラクトディレクトリ、ステージディレクトリ、スタックディレクトリに整理する方法を説明した
  • CDK アプリを管理アカウントとプライマリリージョンにデプロイする CDK パイプラインスタックを定義する方法を示した
  • DynamoDB テーブルから外部データを取得し、それを CDK コードに渡すために別スクリプトでデータを取得して data.json ファイルに書き出す方法を紹介した
  • CDK コードのテスト方法として、スナップショットテスト、ユニットテスト(細粒度のアサーションテスト)、CDK インテグレーションテストランナーを使用したインテグレーションテスト、CDK トリガーモジュールを使用したアプリケーションテストを説明した

COM303: 20 テラバイトを超える大規模なファイルサーバー移行を AWS FSx に自動化

  • 20 テラバイトのファイルシステムと 10 億件超のファイルをオンプレミス NAS から AWS FSx for Windows File Server へ移行し、ダウンタイムは2時間に抑えられた
  • DataSync、Terraform、カスタムスクリプトを使い自動化し、CloudWatch でタスク実行時間をモニタリングしてデータの優先順位付けを行った
  • 顧客は医療機器会社で、一部には患者情報も含まれるセンシティブデータがある
  • 小さなアプリケーションファイルが多数あること、データの重複除去と復元、タスクとエージェントのスケーリングが課題であった
  • Terraform モジュールの作成、出力のパース、スプレッドシートでタスク時間の追跡、データコピーの優先順位付け、移行プロセスのスクリプト化などのツールとプロセスが開発された

COM304: ドメイン駆動設計と Amazon DynamoDB を用いた構成可能なアーキテクチャ

  • 講師はドメイン駆動設計 (DDD) について説明した。DDD は、ソフトウェアアプリケーションの設計をドメインとビジネス要件に基づいてモデリングするソフトウェア開発手法である。
  • DDD の原則を適用することで、ソフトウェアがそれぞれ特定のタスクを行う複数のモジュールに分割された構成可能なアーキテクチャになる。
  • コワーキングスペースの会議室予約システムを例に、DDD を設計する方法が説明された。ステークホルダーとの議論から得られたキーワードから統一言語が形成された。
  • サブドメイン、バウンデッドコンテキスト、コンテキスト間の相互作用をマッピングすることで、初期の構成可能なアーキテクチャが導出された。
  • 予約サブドメインに対して戦術的 DDD が適用され、エンティティ、バリュオブジェクト、アグリゲートが特定された。
  • アグリゲートは DynamoDB のシングルテーブル実装のデータモデルのアクセスパターンと設計に使用された。
  • 要約すると、DDD はソフトウェア設計をビジネスドメインと要件に合致させ、モジュール化された最適化されたアーキテクチャとデータモデルを導く。DDD により生成されたモデルとドキュメントは、ソフトウェアに長期的な利点を提供する。

COM305: AWS Lambda のコールドスタート対策と最適化方法

  • AWS Lambda で新たな機能「プロビジョニングコンカレンシー」が提供開始され、これによりコールドスタートレイテンシーの低減が可能に
  • お客様事例として、コールドスタートの問題からサーバーレスから移行したケース
  • 異なるランタイム (Node.js、Python、Rust、Java など)、SDK、依存関係サイズ、設定条件下での起動時間のベンチマーク
  • AWS Lambda でコンテナサポートの改善で、ZIP デプロイメントに比べて最大 15 倍高速な起動時間が実現可能
  • AWS Lambda Power Tuning などのツールを用いたメモリ設定の最適化方法

COM306: Rust を使って AWS Lambda のパフォーマンスを向上させる :Rust バインディング、ゼロからの書き換え、Lambda 拡張機能の利用

  • 既存の Python Lambda 関数のパフォーマンス向上とコスト削減のために、Rust を使う3つの戦略が紹介された :Rust バインディング、Rust からゼロから Lambda を書き換え、Lambda 拡張機能の使用
  • Rust バインディングアプローチでは、Python コードのボトルネック部分を Rust に置き換えることで、全体を書き換えることなく大幅なパフォーマンスとコスト向上が実現された
  • Rust からゼロから認証 Lambda を書き換えることで、応答時間が大幅に短縮され、コストも下がった
  • Rust での Lambda 拡張機能アプローチでは、共通のアナリティクスロジックを実行環境間で共有でき、バックグラウンドで分析ロジックを動かしながらも応答を速くすることでユーザーエクスペリエンスが向上した

COM307: AWS の OpenTelemetry(OTel) へのサポートを API と ADOT(AWS Distro for OpenTelemetry) を通じて簡素化し、観測可能性の開発者体験を向上

  • AWS の OpenTelemetry(OTel) へのサポートを API と ADOT(AWS Distro for OpenTelemetry) を通じて簡素化し、観測可能性の開発者体験を向上
  • ADOT エージェント、EKS 上の OTel の Kubernetes エージェント、OpenTelemetry Lambda レイヤーを使用してアプリケーションの計測と CloudWatch や Kinesis Data Streams など AWS サービスへのデータ送信方法を学ぶ
  • OTel コレクタによるデータパイプラインマネジメントと OTel セマンティック規約によるスキーマ管理を通じてデータ生成と AWS に関するベストプラクティスを学ぶ
  • Honeycomb は顧客からのテレメトリデータを分析して自社の「 Retriever 」クエリサービスのパフォーマンスを理解するために AWS Lambda を大規模並列計算に使用

COM308: AWS Kinesis Data Streams と Lambda のサーバレスデータストリーミング :

  • AWS Kinesis Data Streams サービスとして、近実時間データストリーミングが可能となり、Lambda がストリーミングデータのコンシューマとして利用可能になった。
  • Kinesis ストリームへのバッチ書き込み失敗を適切に処理できず、データ損失と重複処理の問題が発生した。
  • Kinesis のオンデマンドキャパシティモードで、自動スケーリングとシャード管理が自動で行えるようになった。
  • SDK でタイムアウトとリトライ設定が正しくなく、失敗監視が適切でなかったこと、Lambda のデフォルトエラー処理設定が原因で、再処理が繰り返された。

CON101: エアカナダ、AWS 上の Red Hat OpenShift Service(Rosa) を利用してエンタープライズメッセージングプラットフォームの近代化を発表

  • エアカナダはエンタープライズメッセージングプラットフォームアプリケーションを AWS 上で稼働する Red Hat OpenShift Service(Rosa) を利用して近代化を発表
  • Rosa は専任の SRE チームによってフルマネージドなオープンシフトアプリケーションプラットフォーム
  • エアカナダのエンタープライズメッセージングプラットフォームの主な要件は 99.95% の可用性、1日 1250 万メッセージ・ 40 万メッセージ/秒のスケーラビリティ、セキュリティ、既存の監視ツールとの統合
  • エアカナダは Rosa 上で IBM MQ クライアント/サーバ、Kafka、IBM App Connect などのアプリケーションを展開してプラットフォームを近代化

CON102: VMware の Tansu Application Platform と AWS を用いたアプリケーション配信の加速

  • VMware の Tansu Application Platform は、開発、運用、最適化の柱に基づいてアプリケーションの提供を加速する一連の製品です。
  • Tansu Backstage による開発者体験と導入、連続的インテグレーション/デプロイメントのためのサプライチェーン、大規模 Kubernetes クラスタの管理のための Tansu Kubernetes Operations (TKO) を含みます。
  • Backstage の主な機能は、プロジェクトセットアップのためのテンプレート/アクセラレータ、統合された開発者ポータル、Spring との統合が含まれます。
  • TKO はクラスタの健全性の表示、ポリシーの設定、クラスタ間のロールベースのアクセスの設定、バックアップの自動化などを可能にします。

CON203: Amazon EKS の将来:クラスタの Kubernetes バージョンを最大 26 ヶ月に延長、IAM 統合の簡易化、VPC CNI ネットワークポリシーの利用、CloudWatch の観測可能性の強化、エージェントレス Prometheus メトリクス収集、自動ノードプロビジョニング/クラスタコンソリデーション

  • Amazon EKS のクラスタで実行可能な Kubernetes バージョンを最大 26 ヶ月(以前は 14 ヶ月)に延長できるようになった Extended Version サポート
  • IAM 統合を簡単にし、Pod レベルの認証と権限管理を行う AWS Pod Identity
  • AWS API 経由で IAM アクセスをクラスタに設定できる Cluster Access Management
  • 追加エージェントなしでビルトインの Kubernetes ネットワークポリシーが利用できる VPC CNI ネットワークポリシー
  • クラスタダッシュボードの自動化とメトリクス/ログの CloudWatch 統合による強化された CloudWatch の観測可能性
  • メトリクスのスクレイピングと CloudWatch への送信によるエージェントレス Prometheus メトリクス収集
  • ノードプロビジョニングとクラスタのコンソリデーションを自動化する Carpenter
  • Slack は Carpenter、オートスケーリンググループ、Nebula ファイアウォールを使用し、アプリケーションの 80% を EKS 上で実行し規模を拡大できる
  • Anthropic は S3 でステート管理と Carpenter によるコスト最適化で EKS 上で大規模な ML モデルを Kubernetes 規模で訓練できる

CON204: Kasten K10 を使用した Kubernetes データ管理とスケーリングの強化

  • Casten K10 はクラスタ間オーケストレーションを強化し、スケーラビリティとセキュリティが向上しました
  • 複数の Kubernetes クラスタを1つのダッシュボードから集中的に管理できるようになりました
  • 2 次クラスタは単一のイングレスポイントを通じてプライマリクラスタに接続し、ネットワーク設定が簡素化されました
  • シークレットは外部の AWS Secrets Manager に保存され、外部シークレットオペレータを使用してクラスタに安全に Pull されます
  • アプリケーションブループリントにより、Kubernetes クラスタと Amazon RDS のようなデータベースに跨がる状態維持アプリケーションを保護できます
  • 顧客は Kubernetes パーシステントボリュームから Amazon RDS へデータベースワークロードを移行し、スケーラビリティと管理性が向上します

CON205: アマゾン ECS を利用したアプリケーションの近代化と高速化

  • アマゾン ECS は、高度にセキュアかつ信頼性が高く、スケーラブルなコンテナを実行するためのフルマネージドなコンテナオーケストレーションサービスです
  • ユナイテッド航空はアプリケーションをモノリシックからマイクロサービスに移行し、アマゾン ECS を利用してアプリケーションを近代化し、驚異的な結果を達成しました
  • ECS タスクの実行時セキュリティモニタリングのための Guard Duty for ECS が発表されました。これは EBPF を利用して ECS タスクをモニタリングします
  • コンテナイメージダウンロードを高速化する Sika below C I(SOCHI) が議論されました。これは最初に必要なファイルのみをダウンロードすることで、起動時間を短縮します

CON206: Amazon EKS を利用した Kubernetes の旅路の加速 - EKS は自動的にクラスタのアップグレードとスケーリングを行い、最大 26 ヶ月にわたる延長サポートを提供します。新しい機能としてクラスタオートスケーラーや脅威検知、アクセス管理 API、コスト最適化バンドル、AWS マーケットプレイス経由のアドオン導入、デジタルラーニングなどが発表されました。

  • Amazon EKS は製品レベルの Kubernetes クラスタを提供し、コントロールプレーンのアップグレードとスケーリングを自動で行います。
  • 顧客はインフラの管理ではなくアプリケーションに集中できます。
  • EKS は現在4バージョンの Kubernetes をサポートし、最大 26 ヶ月にわたる延長サポートを提供します。
  • EKS のマネージドノードグループはノードのプロビジョニングとスケーリング、並列にノードアップグレードを行います。
  • 新しいオープンソースのクラスタオートスケーラー Carpenter はポッド仕様に基づいて最適なノードをプロビジョニングします。
  • Amazon Guard Duty はランタイムプロテクションエージェントにより EKS ワークロードの脅威検知を提供します。
  • 新しいクラスタアクセスマネジメント API は EKS でのユーザ認証と権限管理を簡素化します。
  • EKS の QCost バンドルは追加ライセンス料無しでコスト最適化機能を提供します。
  • EKS は AWS マーケットプレイスを通じてサードパーティソフトウェアをアドオンとしてデプロイします。
  • 最初の EKS デジタルラーニングバッジと認定コースの発表です。

CON207: AWS 上で動作する完全管理型の Kubernetes プラットフォーム「 Rosa 」について

  • Rosa は AWS 上で動作する完全管理型の Kubernetes プラットフォームです。
  • Rosa は観測可能性やセキュリティなどのビルトインサービスと共に完全管理型のコンテナプラットフォームを提供します。
  • Rosa は Kubernetes の運用を簡素化し、ツールやインテグレーションによる開発者体験を提供します。
  • Rosa は Migration Toolkit for Containers オペレータなどを使ってクラウドへのワークロードの移行をサポートします。
  • Rosa Classic はインフラストラクチャノードとコントロールプレーンを顧客の AWS アカウント内で実行します。Rosa with Hosted Control Plane ではこれらのコンポーネントを Rosa サービスアカウントに移動します。
  • Rosa の最近の機能は GPU インスタンス、ローカルゾーン、カスタムタギング、追加リージョンサポートなどが含まれます。
  • 今後の機能として Rosa with HCP のさらなるリージョンでの一般提供、認証、ワークロード移行の強化などが予定されています。

CON209: AWS App Runner によるコストとパフォーマンスの最適化

  • App Runner( アプ・ランナー)は EC2 インスタンスやロードバランサーの管理なしに AWS クラウド上でウェブアプリケーションや API を実行できる完全管理型サービスです。
  • 自動スケーリング、継続的デプロイ、管理されたランタイムバージョンを提供します。
  • AWS サービス(ネットワーク、証明書管理など)と統合できます。
  • ファイアクラッカーバーチャルマシン (VM) を使用したコンテナ分離と IAM ロール統合によるセキュリティ機能を提供します。
  • CloudWatch でログ、メトリクスの観測機能を提供します。
  • トラフィックに基づいた自動スケーリングと、トラフィックがない時はアプリケーションの一時停止によるコスト最適化を提供します。

CON303: アマゾンが生成 AI サービスを大規模に展開するための考慮事項

  • アマゾンは、AI コーディングアシスタント「 Amazon CodeWhisper AI 」、基盤モデル「 Amazon Titan 」、コードなしでアプリを構築できる「 Amazon Party Rock 」など、新しい生成 AI サービスを発表した。
  • 生成 AI は、個別の顧客体験の作成、コーディングタスクの自動化による生産性向上、新コンテンツの生成、予測の高速化のための洞察の生成などに利用できる。
  • 生成 AI アプリケーションを大規模に構築する上での主な考慮事項は、基盤モデルの理解、事前学習モデルの利用、クラウドサービスの活用、責任を持った開発と展開である。
  • プロンプトエンジニアリングや RAG の技術を用いることで、特定のドメインや質問に対するモデルの応答を改善できる。

CON307: AWS Fargate のタスク起動時間最大 60% 短縮、コンテナイメージの遅延読み込み機能「 SOCI インデックス」対応

  • AWS Fargate が SOCI(Seekable OCI インデックス)に対応し、コンテナイメージの遅延ロードによりタスク起動時間を最大 60% 短縮
  • SOCI インデックスはコンテナイメージ内のファイルインベントリを提供。Fargate はタスク起動時に必要なファイルのみ取得
  • AutoDesk、Flywire、Veritas が SOCI を使用した Fargate でタスク起動時間が 40~60% 短縮したと報告
  • AutoDesk はより速いタスク起動によりアイドルコンピュート容量需要を下げ、コスト削減
  • Flywire は速いタスク起動でアプリケーションアップデートロールアウト時間を大幅短縮
  • Veritas は高負荷時のタスク起動性能向上でバースティワークロード対応力アップ

CON309: Pinterest が大規模な Spark データ処理を Amazon EKS クラスタで実行 -Hadoop から Spark への移行と 1000 ノード規模への拡大計画

  • Pinterest は、クラウドネイティブ、アジリティ、コスト効率性のメリットを得るために、Hadoop から Spark へとデータ処理作業を移行した
  • Pinterest は現在約 800 ノードの EKS クラスタで大規模な Spark を実行しており、年末までに 1000 ノード規模に拡大する計画
  • Pinterest にとってのメリットは、Graviton プロセッサを活用したコスト削減、AWS サービスとの統合、AWS のブループリント/テンプレートの再利用
  • 課題としては、ネットワーキング、コントロールプレーンのログ、Hadoop 固有のサービスの代替サービスへの置き換え、大規模運用

CON311: Amazon EKS を使用したプラットフォームエンジニアリングのベストプラクティスとカスタマーケーススタディ

  • AWS のケビン・コールマンさんとローランド・バルシアさんが、プラットフォームエンジニアリングのベストプラクティスとカスタマーケーススタディについて説明した
  • セールスフォースは内部プラットフォームのハイパーフォースを EKS の上に構築し、100 万以上のポッドと 1000 以上の EKS クラスタを使用して顧客に信頼できる AI を提供している
  • NASA はEクラスタを使用して内部データプラットフォームを構築し、JupyterHub、Crossplane、FluxCD などのツールを使用して科学者がデータを共有し再現可能な結果を生成できるようにしている
  • ニューヨーク・タイムズは EKS を使用して内部開発者プラットフォームを構築し、マルチアカウントアーキテクチャでテナントの分離を行い、複数のリージョン/アベイラビリティゾーンの EKS クラスタとチーム毎の名前空間で分離を行っている
  • ニューヨーク・タイムズのプラットフォームでは Istio でサービスメッシュ、OpenPolicyAgent でポリシー、ArgoCD で GitOps ワークフロー、Backstage で開発者ポータルとして利用している

CON312: Amazon EKS 上で生成型モデルを展開する未来のナビゲーション :

  • AWS は EKS 向けの新しい CSI ドライバーで S3 に Kubernetes ネイティブインターフェイスを提供し、数千のインスタンスにわたるペタバイト規模のデータの簡単な統合を実現しました。
  • Adobe は、Adobe Firefly 製品などの ML/AI ワークロードをサポートするために、内部の EKS プラフォームを拡張した経験談を共有しました。Argo CD や EKS の自動スケーリング機能といったサービスを活用しています。
  • Kubernetes 上で ML ワークロードを実行する一般的な課題として、依存関係管理、スケーリング、リソース利用効率、セキュリティが議論されました。コンテナ、Kubernetes 機能、オープンソースプロジェクトなどのソリューションでこれらの課題を解決できるとされました。

CON313: Amazon ECS と AWS Fargate を活用したマルチテナント型 SaaS アプリケーションの構築と長期的なビジネス継続性の確保

  • AWS ECS と Fargate を活用したマルチテナント型 SaaS アプリケーションの構築方法と、可用性、セキュリティ、新機能の開発能力、長期的なビジネス継続性の確保
  • イソレーション、ID 管理、セル構成、セキュリティグループ、ログ、モニタリング、オートスケーリング、Graviton、スポットインスタンス、イベントドリブンアーキテクチャを活用したコスト最適化戦略などのキー要因

CON318: AWS Fargate と Graviton を使用してコストを 70% 削減した方法―スマートシートの事例

  • スマートシートはグリッドサービスをスケールするためにセルベースアーキテクチャを採用した
  • 6 ヶ月以内に AWS Fargate と Graviton を使用してコストを 70% 削減できた
  • ピークトラフィックを 1,000 RPS から 50,000 RPS に拡大し、デプロイ頻度を週1回から毎日に高速化できた
  • スマートシートは Fleet パーティション、個別キュー、Excel バッチ処理のような専門サービスを使用して異なるワークロードタイプの最適化を行っている
  • AWS の管理サービスである CodePipeline、CodeBuild、CodeDeploy を使用して自動デプロイを数時間から数分に高速化できている
  • ロードバランシング、パフォーマンスモニタリング、バックグラウンド処理の技術を使用して 6-12 ヶ月以内にグリッドプラットフォームサービスを 50 倍スケールできた

CON320: AWS サーバレスサービスを利用した未来への構築

  • AWS Step Functions が Amazon Bedrock と統合し、ステートトランジションから基盤 AI モデルの呼び出しを可能にする
  • AWS Step Functions が Stripe 決済ゲートウェイとの統合を通じ、ワークフローから支払い処理を可能にする
  • Lambda 関数のスケーリング改善で、トラフィック増大に対応した高速な関数の自動スケーリングを実現
  • Guard Duty のランタイムモニタリングが Fargate 上の ECS ワークロードにも拡張され、脅威検知を実現
  • Nationwide Children's Hospital の事例で、Step Functions と Lambda などサーバレステクノロジーを利用し、小児がんサンプルの分析と診断を高速化

CON322: AWS Fargate を利用したコンテナアプリケーションの運用コストとダウンタイムの削減

  • AWS Fargate は、サーバーのプロビジョニングや管理が不要なコンテナ向けサーバーレスコンピューティングエンジンです
  • 新規 ECS 顧客の 70% 超が AWS Fargate 上でワークロードを実行
  • 某金融サービス企業は、第三者のコンテナオーケストレーションシステムから AWS Fargate への移行により、6か月以内に 800-1000 万ドルのライセンスコストを削減
  • AWS Fargate では CPU 利用率などのメトリクスに基づいてコンテナタスクを自動的にスケーリングし、トラフィック変動に対応
  • AWS Compute Optimizer は AWS Fargate における最適なタスクサイズの推奨によりコスト削減を図る

CON325: Amazon ECS と AWS Fargate での AWS Guard Duty の実行時監視機能

  • Amazon ECS と Fargate での Guard Duty の実行時監視サポートのアナウンス
  • Guard Duty は AWS の高度な脅威検出サービス
  • Fargate 上の ECS タスクでは Guard Duty エージェントが自動的にセットアップコンテナとして注入される
  • ECS on EC2 の場合は VPC エンドポイントの作成や Guard Duty エージェントのインストールが必要
  • ECS クラスタで Guard Duty 実行時監視を有効にし、Guard Duty コンテナが新しいタスクに注入される様子をデモ
  • Container Insights で Guard Duty コンテナのリソース利用状況を監視可能
  • Guard Duty の検出結果には脅威が見つかった場合にタスクとコンテナの詳細が表示

CON326: クラウド戦略の再考:パフォーマンスの最適化とクラウドコストの削減

  • Snap は Kubernetes ワークロードの AWS 上での最適化と一部クラスタでの CPU 使用率最大 35% 低下を実現する Granulate を利用
  • Snap は 32 クラスタ全体で平均 13% のコスト削減。以前手動で行っていた最適化を Granulate が自動化し、エンジニアの時間転用
  • Granulate は Snap がこれまで焦点を当てていなかった小規模サービスの最適化も行い、全体の効率性向上に寄与
  • 今後 Apache Spark ジョブなど大規模データワークロードの最適化にも Granulate を利用予定

CON327: Amazon EKS の内部仕組み :

  • Amazon EKS は Kubernetes を使用したコンテナ化アプリケーションのデプロイ、管理、スケーリングを支援します
  • Amazon EKS はバニラの Kubernetes を実行し、アップストリームの互換性テストをすべて通過します
  • Amazon EKS は現在6バージョンの Kubernetes をサポートしています
  • Amazon EKS は Kubernetes コントロールプレーンの複雑な操作とアップグレードを管理します
  • Amazon EKS は医療、製造、金融サービスなどさまざまな業種でレガシーモダナイゼーション、AI/ML、データ処理、IoT、Web アプリケーションなどに使用されています

CON331: Kubernetes クラスタのオートスケーリングツール Karpenter の力を活用して、Kubernetes クラスタをスケール・最適化・アップグレードする

  • Karpenter は AWS で構築された柔軟で高性能な Kubernetes クラスタオートスケーラーで、アプリケーションロードの変化に応じて適切なコンピューティングリソースを迅速に起動し、アプリケーションの可用性とクラスタの効率性を高めるオープンソースソフトウェアです。
  • スポットインスタンスや Graviton インスタンスなど、様々なインスタンスタイプの選択が可能です。
  • ノードの日常運用でのアップグレードを簡単に行えます。
  • コストの最適化とスケジューリング制約の実装をサポートします。
  • EKS クラスタのアクセス管理機能の強化。AWS API を利用したクラスタへのアクセス制御を簡素化します。
  • EKS クラスタ内の Pod に IAM ロールを付与する Pod Identity のサポート強化。
  • EKS 用 VPC CNI プラグインにネットワーク分離機能を実装。eBPF を利用した Pod 間のネットワーク隔離を可能にします。
  • NLB 経由でアクセスされるアプリケーションのセキュリティ強化。NLB に EC2 セキュリティグループの適用をサポートします。
  • EKS コントロールプレーン API に Private Link を適用。VPC 内から安全に API にアクセスできるようになります。
  • Amazon Detective と GuardDuty の EKS クラスタ連携機能強化。セキュリティ監視と異常検知能力向上です。
  • EKS クラスタにデプロイされるコンテナイメージの署名・検証機能。イメージ整合性とセキュリティ強化です。

CON401: Amazon ECS の可用性と回復力の詳細

  • Amazon ECS は AWS 上で動作し、EC2 インスタンスや Fargate を使用したサーバレスコンテナコンピューティングでコンテナをデプロイできるネイティブコンテナサービスです
  • Amazon ECS は全 AWS リージョンでインストールされており、高可用性と障害からの回復力を持つためにアベイラビリティゾーンを使用しています
  • Amazon ECS はワークロードの分離と非生産環境での変更テストを可能にするためにコントロールプレーンを複数のパーティションに分割しています
  • Amazon ECS はアベイラビリティゾーン、スティックスケーリング、ローリングデプロイメントを利用しながら可用性と回復力を保持した上で継続的デプロイが可能です
  • Amazon はインシデントから学び、レッスンを学んだ成果に基づいて継続的に改善しています

CON405: Amazon ECR の新機能と性能向上

  • Amazon ECR は Docker Hub、Google Container Registry、Azure Container Registry など認証が必要なレジストリに対応しました
  • ライフサイクルポリシーではワイルドカードマッチングに対応し、一致するタグと削除されるイメージをより精緻に制御できるようになりました
  • プルスルーキャッシュでは私的なイメージのプルに認証付きレジストリに対応しました
  • 基本スキャンの対象 OS が Amazon Linux 2023 を含む最新 OS に拡大しました
  • パフォーマンス向上としてプル性能が2倍、今後プッシュとプルが 2-4 倍向上予定です
  • レプリケーションルールでインクルード/エクスクルードリストに対応し、地域間でリプリケートするタグを選択的に制御できるようになります

COP203: AWS コスト管理機能の強化 - 課金・コスト管理コンソールの統合、過去 38 ヶ月分のコストデータ提供、AWS コストレポート Ver2.0 の提供、クイックサイトからのコストダッシュボード表示、アプリケーションコストとリソースタグのリンク、課金グループとカスタム価格設定の活用など

  • AWS 課金・コスト管理コンソールホーム画面が統合され、課金とコスト管理サービスが1か所で確認できるようになった
  • コストエクスプローラーで最大 38 ヶ月分の過去データ(無料)と全 AWS サービスのリソースレベルデータ(無料)が提供されるようになった
  • AWS コスト&使用報告書 Ver2.0 が固定スキーマと改善されたデータエクスポート体験で提供されるようになった
  • 課金コンソールからアマゾンクイックサイトを起動し、対話型のコスト&使用量ダッシュボードを表示できるようになった
  • アプリケーションコストを App レジストリのリソースタグに直接リンクし、割り当てが向上した
  • AWS 課金コンダクタで課金グループの作成とカスタム価格設定を活用し、課金モデルのサポートが可能になった

COP204: AWS のコスト最適化に関する新機能

  • コンピュートオプティマイザのカスタマイズ機能が強化され、CPU 使用率の閾値や予備容量の調整、インスタンスファミリやタイプの選択などが可能に
  • コンピュートオプティマイザの GPU 最適化機能がリリースされ、GPU、CPU、メモリ、ディスク、ネットワークのリソースを GPU 使用ワークロードに合わせて適切にサイジング
  • コンピュートオプティマイザの SQL ライセンスオプティマイズ機能がリリースされ、エンタープライズからスタンダードにダウンサイジングすることでコスト削減
  • コンピュートオプティマイザの推奨結果に AMD GENOA、Graviton、Flex インスタンスなど新しいインスタンスタイプが対応
  • コンピュートオプティマイザにオンデマンド支出グラフと推奨サービングスプランを重ねて表示する新規機能がリリース
  • アカウントやリージョン横断したオプティマイゼーション機会を一元管理し、月単位の予測節約額を表示するカスタマイゼーションハブがアナウンス

COP209: AWS コンプライアンスと監査サービスのカスタマイズ方法

  • AWS( エイ・ダブリュー・エス)は、コンフィギュレーション変更の日次レコーディングオプションを提供し、継続的なレコーディングではなく日次ベースでレコーディングを行うことで、AWS Config のコストを削減できるようになりました。
  • AWS は、AWS CloudTrail Lake の新しい価格オプションを発表し、1年間のデータインジェストと保持に対して、従来の価格設定よりも低コストで提供します。
  • AWS は、Amazon Athena を利用した AWS CloudTrail インサイトとクエリのサポートを AWS CloudTrail Lake に拡張しました。
  • アーティックウルフは、AWS Config、AWS Security Hub、AWS CloudTrail Lake などのサービスを利用して、コンプライアンスとセキュリティの centralized な環境を構築しています。
  • アーティックウルフは、AWS Config で特定のリソースタイプを除外したり、セキュリティハブのルールを利用して、コストを削減し、セキュリティデータを1か所で管理できるようにカスタマイズしています。

COP214: ハイランドソフトウェアは、Turbinic を用いた仮想マシンと AWS リソースの適正規模設定と配置の自動化で、360 万ドルの資本支出と 30 万ドルのコスト削減を実現した

  • ハイランドソフトウェアは、仮想マシンの稼働率向上とコスト削減のために、Turbinic のワークロード配置自動化と適正規模自動化を実装した
  • 13 テラバイトのメモリと 7000 個の CPU コアを回収することで、60 台の ESX サーバーで 360 万ドルの資本支出を先送りできた
  • AWS リソースに対しては、未利用のボリュームの自動削除、EBS ボリュームとインスタンスの適正規模設定を自動化するポリシーを実装し、2023 年 10 月時点で 300 万ドルを節約できた
  • 1 万件の自動スケーリングアクションで、作業チケットと手動作業の時間を節約できた
  • ハイランドは、Kubernetes への移行が進むにつれ、同様のアプローチで Turbinic を用いた適正規模設定と配置の自動化をコンテナにも適用する計画

COP215: - スプランクのプラットフォームは、様々なソースからのデータを単一のプラットフォー�ムに取り込み、エンドツーエンドの可視性を得た上で、セキュリティや監視などのワークロードを連結データに対して実行できる

  • Splunk のプラットフォームは、様々なソースからのデータを単一のプラットフォームに取り込み、エンドツーエンドの可視性を得た上で、セキュリティや監視などのワークロードを連結データに対して実行できる
  • ハイネケンは、 Splunk のプラットフォームを利用し、70 か国以上における事業のエンドツーエンドの可視性を得ることで、穀物からビールの提供までのプロセスの信頼性と監視を行っている
  • プーマは、Splunk を利用して、事故解決時間を時間から 10-15 分に短縮し、エレクトロニックコマースインフラ全体の可視性を得ることで、10 万ドル超の停止コストを回避している

COP218: AWS の利用コスト削減の可能性について

  • AWS は、Aws Computer Optimizer の新しいカスタマイズされた推奨機能を発表し、必要なヘッドルームパーセンテージや制限されたインスタンスタイプなどのサイジング設定優先順位を設定できるようになりました。
  • CloudFix は、数十億ドル規模の AWS 請求書にわたる使用統計を分析することで、AWS 支出を 10 億ドル以上削減できました。
  • EC2 インスタンスの平均利用率はわずか 6% で、コスト最適化の大きな余地があることが示されました。
  • S3 バケット内のオブジェクトの 90% 超が1回だけアクセスされており、希にアクセスされるため全価格を支払っていることがわかりました。
  • デフォルトのネットワーク設定は 300% 以上高価になる可能性があるため、VPC エンドポイントを使用して内部トラフィックをルーティングする必要があると指摘されました。
  • 4,000 以上のデータベースを1つの Aurora データベースクラスタに統合することで、性能は 10 倍向上しながら、コストも大幅に削減できたことが報告されました。

COP219: AWS を使ったクラウドコスト最適化の方法とツールが紹介された

  • AWS のエキスパートからクラウドコスト削減のヒントとして、インスタンスの適切なサイズ合わせ、使用していないリソースの停止、自動スケーリングの使用、使用していないリソースの削除が紹介された。
  • AWS Cost Optimizer ツールを使用して、コスト削減のためにリソースの最適化に関する提案がデモンストレーションされた。
  • CloudFix ツールが紹介され、このツールでは自動サービスダッシュボードを通じた修正でクラウドコストの最適化機会を見つけ、実装ができる。
  • AWS Compute Optimizer の提案は CloudFix での最適化実装の入力データとして使用される。
  • RDS、OpenSearch、Lambda などのマネージドサービスやサーバレステクノロジーが、管理オーバーヘッド軽減のために推奨された。
  • Graviton インスタンスの使用は、ARM ベースのプロセッサによるコスト削減の方法として強調された。

COP221: トップゴルフは LogicMonitor を用いてクラウド移行リスクを軽減しアプリケーション性能を確保

  • トップゴルフは、LogicMonitor を使用して、アマゾンクラウドウォッチに接続し、オンプレミスと AWS デプロイメント全体にわたる知的アラートに迅速に対応することで SLA を超えることができました。

  • トップゴルフは、LogicMonitor を使用して、87 の施設にまたがるハイブリッドアプリケーションとサービスに対する深層の視認性を得、クラウド移行リスクを軽減し、移行後のアプリケーション性能を確保しました。

  • LogicMonitor は、トップゴルフに対して、ハイブリッド環境全体にわたるインフラ、デバイス、依存関係に対するシングルペインオブグラスの視認性を提供しました。

  • トップゴルフは、LogicMonitor のダッシュボードを使用して、技術メトリックをビジネスメトリックに変換し、非技術的ステークホルダーが理解できるようにしています。

COP222: アプリケーションのセキュリティをコードからクラウド環境までシフトレフト&シールドライトで保護する Prisma Cloud の新機能

  • Palo Alto Networks は、ネットワークセキュリティ、セキュリティオペレーション、コードからクラウドに至るアプリケーションセキュリティの変革に注力している
  • Prisma Cloud は、クラウド環境全体の可視性を提供し、リスクを優先度付け、コードやクラウド内で直接修正を可能にする
  • 新機能は、シャドウ IT 資産の発見、アプリケーションのリスクを可視化するアプリケーション DNA、攻撃経路分析、統合された脆弱性管理を含む
  • 修正は、クラウド内で直接修正するか、コード内でプルリクエストを割り当てることで自動化される
  • 新しい AI アシスタントコピロットは、環境のセキュリティポスト ure と脆弱性について質問に答える

COP223: クラウド上のアプリケーションのコスト、パフォーマンス、セキュリティの最適化を目的とする VMware Tanzu Intelligence Services の導入と機能

  • VMware Tanzu Intelligence Services( 近代アプリケーションのクラウド上でのコスト、パフォーマンス、セキュリティの最適化を目的とする製品ファミリ)の導入
  • Tanzu Intelligence Services には、マイグレーション評価の Tanzu Transformer、デリフト検出とポリシー強制の Tanzu Guardrails、イベント集約と異常検出の Tanzu Insights、コスト最適化の CloudHealth が含まれる
  • Tanzu Hub は、複数クラウド上のアセットに関するシングルビューを提供する共通プラットフォームとデータモデルとして機能する
  • CloudHealth は、Flex Orgs によるアクセス制御、タグベースグルーピングの Perspectives、ショウバック/チャージバックレポートによりコスト最適化を支援

COP224: クラウドコスト最適化ソフトウェア「スリングショット」の発表 - スノーフレークの使用料最適化とデータ支出向上を目指す

  • キャピタルワンは、新たに立ち上げたエンタープライズ向け B2B 部門のキャピタルワンソフトウェアから初めて市場に出されたクラウドコスト最適化製品「スリングショット」を発表した
  • スリングショットは、Snowflake の使用料最適化に焦点を当て、コストスパイクの通知、インフラの適正規模推奨、高コストクエリの最適化アドバイザ、修正の実装ワークフロー自動化などの機能を提供
  • キャピタルワンは、組織全体で FinOps 原則を適用し、スキル投資、支出意識文化形成、進捗を示す KPI 測定によりクラウドの価値最大化を図っていると説明
  • キャピタルワンは、クラウド支出の 40% が共用データプラットフォームに向けられており、インフラとワークロードを所有するチーム間の調整が取れにくい課題があると説明
  • スリングショットには、これらの課題に対処し、データ支出と問題に関する透明性向上を通じて共有責任を実現する機能を盛り込んだと説明

COP226: テラデータ、Cisco の Multi Cloud Defense ソリューションを利用し、AWS 上の 100 社以上の顧客のワークロードを安全に管理

  • テラデータは Cisco Multi Cloud Defense を利用し、AWS アカウントとリージョン間で 100 社以上の顧客のワークロードを安全に管理
  • Cisco ソリューションを使用することで、新規顧客のプロビジョニング時間を 50% から4分未満に短縮
  • 以前は数時間かかっていたポリシーの更新を数秒で完了
  • インフラアップグレード作業を数時間から4分未満に短縮
  • Cisco ソリューションを導入しインフラコストを 35% 削減
  • テラデータは初めに Cisco ソリューションを VT Cloud Enterprise プラットフォームで、現在は Cloud Lake アナリティクスプラットフォームでも利用

COP228: クラウド移行時のセキュリティ対策とオートメーションの最新事例

  • クラウド移行プロセス初期段階でセキュリティブループリントを作成する重要性を強調。ブループリント未作成による期限切れ API キーで数百万ドルの頻発障害事例紹介。
  • オートメーションにより、ログやアラートではなくコンテキスト付きインサイトを提供することで、データ容量課題の乗り越えを説明。
  • AI/ML が脅威検知と修復時間の短縮、攻撃被害範囲縮小に役立つ事例を紹介。
  • ソリューションはデータ整合性、起源、偏見への対応方法で評価すべきことを推奨。

COP318: クラウドガバナンスのベストプラクティス - AWS Control Tower と SPS Commerce の取り組み

  • AWS Control Tower がデータの置場所、アクセス制限の細粒度設定、暗号化、耐障害性能能力などデジタル主権性を支持する新たな 65 のコントロールをリリースしました。
  • SPS Commerce がサービス ID に基づいてリソースを自動的にタグ付けするタギングエンジンを実装し、ガバナンスと所有権帰属を向上しました。
  • SPS Commerce が Control Tower を使用して所有権の分散とリスク低減を実現するマルチアカウントモデルに移行し、現在では 25 分以内にアカウントのプロビジョニングが可能です。
  • SPS Commerce が 35 のセルフサービス型と 18 のサービスマネージドの CloudFormation スタックを利用して、アカウントのプロビジョニングとガバナンスの適用を Step Functions で実現しています。

COP319: コンテナの観測性能の最適事例 - EKS 用 Container Insights の新しい価格モデルでメトリックコスト最大 97% 削減可能で、メトリックとログの収集を統合 - Container Insights や APM、AWS アラームとの連携でアプリケーションやエンドユーザーに影響するリスクを特定・解析

  • Amazon EKS 用の Container Insights で新しい価格モデルを導入し、メトリックのストレージとログのインジェストを単一のメトリック観測価格次元に統合することで、メトリックコストが最大 97% 削減できることをアナウンスした
  • EKS 用のエージェントレス Prometheus メトリックコレクションと、EKS 用の CloudWatch エージェントアドオンをデモンストレーションした
  • Container Insights、アプリケーションパフォーマンスモニタリング (APM)、AWS ベストプラクティスアラームとの統合を紹介し、アプリケーションとエンドユーザーに影響を与えるリスクを特定して解析するのに役立つ

COP320: AWS Systems Manager を利用した運用管理の集約と自動化

  • AWS Systems Manager を利用し、AWS アカウント、リージョン、環境(オンプレミス、ハイブリッドを含む)全体の運用管理を集約できる。プロセスの自動化、パッチ適用、リソース変更、インシデント回復などが可能。
  • Mulesoft は、AWS Systems Manager の Agent、Patch Manager、Resource Data Sync、Run Command などを利用し、2週間に1回、40 万台超の EC2 インスタンスをパッチ適用でき、アプリケーションやサービスに影響なく維持できた。これによりパッチ適用コンプライアンスを維持できた。

COP321: AWS 上での運用のベストプラクティスと Itau 社の事例から学ぶ AWS 運用の進化

  • AWS の運用でのベストプラクティス(運用モデルの定義、アカウント戦略の整合性、ガバナンスの集中、運用の自動化)について説明した
  • Systems Manager の機能(視覚的な自動化、フィーチャーフラグ)でレジリエンス(回復力)を高める方法をデモンストレーションした
  • Itau が 2018 年から現在にかけて AWS 上での運用をスケールアップ(拡張)したケーススタディ(チームの再教育、インシデント(トラブル)の削減、デプロイの増加)
  • Itau はアカウントプロビジョニング(提供)を集中型パイプラインから EventBridge を使って分離しスケール可能にすることで進化した
  • Itau は現在、標準化されたスタックとサービスをプロダクトチームが利用できるプラットフォームエンジニアリングチームとして運用することを目指している

Discussion