📖

re:Invent 2025: Toss SecuritiesのAmazon Bedrockによるテスト自動化事例

に公開

はじめに

海外の様々な講演を日本語記事に書き起こすことで、隠れた良質な情報をもっと身近なものに。そんなコンセプトで進める本企画で今回取り上げるプレゼンテーションはこちら!

re:Invent 2025 の書き起こし記事については、こちらの Spreadsheet に情報をまとめています。合わせてご確認ください

📖 re:Invent 2025: AWS re:Invent 2025 - Toss Securities’ AI Transformation with automated Super App Ops. (GBL301)

この動画では、AWSのMoon JongminとToss SecuritiesのNamkyuが、Amazon BedrockとAmazon Novaを活用したテスト自動化プラットフォームの構築事例を紹介しています。Toss Securitiesは、ローンチから3年で韓国の海外株式取引プラットフォーム第1位になるほど急成長しましたが、毎日数十の新バージョンをリリースする中で、テストと検証が追いつかないという課題に直面しました。そこで、Direct Connectで接続された完全隔離AWS環境上に、Webインターフェースからレイテンシーなしでデバイスを制御できるプラットフォームを構築。Amazon Nova MicroとLiteを使用したエージェントが、RAG引数検索と画像解析を組み合わせて、自然言語からワークフローを自動生成します。gRPC通信でデバイスを制御し、TypeScriptの型システムで柔軟なノード追加を実現。今後はFigmaとの統合やAtlasマップによる画面遷移の自動分析を計画し、自然言語からあらゆるインタラクションを自律的にテストできるエージェントの実現を目指しています。

https://www.youtube.com/watch?v=XwbL5fPHzsw
※ こちらは既存の講演の内容を最大限維持しつつ自動生成した記事になります。誤字脱字や誤った内容が記載される可能性がありますのでご留意下さい。

本編

Thumbnail 0

Amazon BedrockとAmazon Novaの紹介:生成AIアプリケーション構築のための完全マネージド型プラットフォーム

みなさん、こんにちは。このセッションにご参加いただきありがとうございます。私はAWSのシニアSAマネージャーの Moon Jongmin です。韓国を代表するテック企業の一つである Toss Securities とご一緒できて、本当に嬉しいです。本日は、Toss Securities が AI テクノロジーと AWS サービスを活用して、スーパーアプリの運用をどのように変革したかをお見せします。本日のプランはこちらです。まず私が Amazon Bedrock と Amazon Nova について簡単に説明した後、Namkyu に彼らの実際のストーリー、課題、そしてソリューションと成果についてお話しいただきます。

Thumbnail 30

では、Amazon Bedrock についてお話しします。これは生成 AI アプリケーションを構築するための完全マネージド型プラットフォームで、5 つの主要な機能があります。まず 1 つ目は、モデルの選択肢です。業界をリードする多くの基盤モデルの中から、ビジネスに最適なモデルを選択できます。また、基盤モデルを変更したい場合でも、本番環境のコードを変更する必要がありません。2 つ目は、コストとパフォーマンスです。モデルの選択、インテリジェントなプロンプトルーティング、プロンプトキャッシング、柔軟な推論オプションを通じて、コストとパフォーマンスを最適化できます。3 つ目は、簡単なカスタマイズです。独自のデータでモデルをファインチューニングでき、複雑さなく RAG をセットアップできます。4 つ目は、セキュリティです。データは AWS 内でプライベートに保たれ、エンタープライズグレードのセキュリティが組み込まれており、さらに有害なコンテンツをフィルタリングするガードレールもあります。そして最後ですが、エージェントです。エージェントを構築・デプロイでき、単純なチャットボットを超えた複雑なタスクに対応できます。

Thumbnail 40

では、Amazon Nova について簡単に紹介します。これは Bedrock でのみ利用可能な、当社独自の基盤モデルファミリーで、業界をリードする価格性能を備えています。Nova ファミリーは 4 つのカテゴリーに分かれています。テキストの理解と生成には、テキスト入力とテキスト出力を扱う Nova Micro、そして Nova Lite、Pro、Premier があります。Lite、Pro、Premier はマルチモーダル入力(テキスト、画像、動画)を処理してテキスト出力を生成します。クリエイティブなコンテンツ生成には、Nova Canvas が画像を生成し、Nova Reel が動画を作成します。Nova Audio は音声入力を処理して音声出力を生成する音声間変換モデルです。そして Nova Interactions は、ウェブブラウザ内でユーザーに代わってタスクを自動的に実行します。これらのモデルの中で、Toss Securities はテスト自動化のために Nova Micro と Nova Lite を活用しています。

Thumbnail 120

Thumbnail 190

Thumbnail 200

Toss Securitiesの挑戦:急成長するスーパーアプリのテスト自動化をAIで実現

では、Namkyu から Toss Securities が AWS でどのように課題を解決したかについてお聞きしましょう。 こんにちは。Toss Securities の Namkyu です。 まず Toss について簡単に紹介させてください。Toss は、銀行、投資、ショッピング、ゲーム、ライドシェアリングなど、韓国での日常生活のほぼすべての部分を支えるスーパーアプリです。この広大なエコシステムを持つ Toss は、並外れたスピードで成長しています。一例として、私が携わっている Toss Securities は、ローンチからわずか 3 年で韓国の海外株式取引プラットフォームで第 1 位になりました。

Thumbnail 240

Thumbnail 250

Thumbnail 290

このような急速な成長に伴い、当然ながら大きな成長痛を経験しています。簡潔に言うと、急速な成長がさらに急速な問題を生み出しました。 私たちは毎日数十の新しいバージョンをリリースしています。これらの更新は、銀行、決済、証券、コマース、さらにはゲームまで、すべてが同時に行われています。問題はシンプルでした。私たちのテストと検証がそのペースに追いつけなかったのです。ユニットテストは既に大変でしたし、統合テストはさらに遅くなってしまいました。その結果、重大な問題が生じました。リリースが多すぎて、時間が足りない。国、デバイス、OS バージョンをまたいでテストすることは、毎日の課題でした。 リモートワークがそれをさらに難しくしました。誰もが同じデバイスにアクセスできるわけではありませんでした。特定の機能をテストするために、その正確なモデルを持っている人を探さなければならないこともありました。

Thumbnail 320

夏時間が始まると、グローバル市場の営業時間が予期せず変わります。私たちのトレーディングシステムは、市場がオープンする時間、たとえそれが朝7時だったとしても、その時間に正確にテストする必要があります。トレードエンジニアたちはしばしば夜通し起きて、トレードが正しく実行されたかどうかを手動でチェックしていました。それは疲れるし、やりがいを感じられず、継続するのが難しかったのです。

Thumbnail 350

Thumbnail 370

要するに、私たちが直面した課題は3つの主なカテゴリーに分かれていました。デプロイのスピードに対して品質を維持するのが難しく、多様なモデル全体でテストする必要があり、リモート環境は非常に複雑でした。ログをモニタリング、スケジュール、検証するためのリアルタイムの可視性が不足していました。だからこそ、私たちはこのプラットフォームを構築したのです。

Thumbnail 390

Thumbnail 400

Thumbnail 410

Thumbnail 420

Webインターフェースにアクセスして、ほぼレイテンシーなしで任意のデバイスを即座に制御できます。ご覧の通り、YouTubeビデオにはレイテンシーがありません。テスト中に生成されたすべてのネットワークパケットを自由に検査できるので、期待されたログが自動レポートを通じて生成されたかどうかを即座に検証できます。テストを繰り返し実行するautomated workflowを作成できます。ビジュアルで確認して、各ステップを見つけることができます。必要な時間に実行するようにスケジュール設定できます。

Thumbnail 430

Thumbnail 440

Thumbnail 450

Thumbnail 460

Thumbnail 480

Thumbnail 500

このビデオは、YouTubeを起動して異なるタスクを自動的に切り替えるワークフローの例を示しています。ワークフローを作成した後、クリックするだけです。その後、YouTubeを開くワークフローを作成すれば、クリック可能な要素を見つけることができます。その後、例えば番号2をクリックすると、タブが変わります。

Thumbnail 510

Thumbnail 520

Thumbnail 530

Thumbnail 540

Thumbnail 550

Thumbnail 560

Thumbnail 570

しかし、これを作成することが仕事のように感じられないようにする必要がありました。次のビデオは、LLMがサイトとアクションにアクセスする方法を示しています。Naver.comを起動するよう依頼しました。これは韓国版のGoogleのようなものです。テストはワークフローを作成し、それを保存して、いつでも再利用できるようにします。エージェントはインタラクティブなボタンが何かを言います。このようにして、MCP toolsを呼び出すことができます。そしてエージェントは私の名前のサマリーが何かを言います。

Thumbnail 580

Thumbnail 590

エージェントとの会話を通じて、リアルタイムでワークフローを構築することができます。 この例では、まず Slack DM で5秒ごとに「hello world」と送信するよう指示しました。 その後、それを3秒に変更するよう指示すると、右側に表示されているように、ワークフローがすぐに更新され、期待通りに動作しました。

Thumbnail 610

Thumbnail 620

Thumbnail 660

Thumbnail 670

Thumbnail 690

Thumbnail 700

Thumbnail 710

ここからは、私たちがどのように設計・構築しているかについて説明します。私たちは完全に隔離された AWS 環境を運用しており、Direct Connect を使用することで、チームはオフィスと自宅の両方から開発ネットワークに安全にアクセスできます。サービスは各ツール、ワイヤー、またはコード上にシームレスにデプロイされ、ワークフロー スクリプトは AWS 内の Git サーバーを通じて効率的に管理されています。韓国の厳格な金融規制に準拠するため、Amazon Bedrock 上の隔離されたモデルを活用して、AI 機能を安全に構築しています。 Provider と呼ばれるコンポーネントを使用しており、これは従業員の PC またはデータセンターで実行されているサーバーになります。 Phone が USB 経由で Provider に接続されると、モバイル コントローラーがデバイスに自動的にインストールされます。Provider はこのコントローラーと gRPC を通じて通信し、デバイスを制御します。 Provider は HTTP を通じてオートメーション プラットフォーム サーバーと通信します。 これにより、ユーザーは複数のデバイスを制御でき、自分のデバイスを接続して、既存のテスト スクリプトを追加の手順なしで学習できるようになります。

Thumbnail 720

Thumbnail 740

Thumbnail 770

既存のワークフロー ソリューションのほとんどは、非常に複雑でした。 厳格な金融規制に対応するのは本当に難しく、また私たちが必要とする ETL パフォーマンスを提供していませんでした。そこで私たちは、十分に高速で、十分に柔軟で、 十分にシンプルなワークフロー システムを構築することに決めました。トポロジカル ソートのような複雑なアルゴリズムに依存する代わりに、接続されたノードに関する情報、つまり前のノードと次のノード、そしてトリガー ID だけを使用してシステムが動作するように設計しました。これは、私個人の開発哲学だけでなく、シンプルが最良であるという幅広い文化を反映しています。

Thumbnail 790

Thumbnail 800

Thumbnail 810

Thumbnail 810

柔軟性の観点から、新しいノードを実行時に追加でき、すぐにあらゆるワークフローに影響を与えるようにシステムを設計しました。TypeScript を選択した理由は、その型システムにより、各ノードの入力パラメータを簡単に定義・検証できるからです。 入力パラメータではデフォルト値を使用できます。 では、このプロジェクトで AI がどのように実際に機能しているかを見てみましょう。ユーザーが「Amazon の株価を教えて」というようなことを言うと、 エージェントはまず RAG 引数検索を実行して、類似したテスト ケースを取得します。類似した例が見つからない場合、エージェントは検索なしで直接推論にフォールバックします。次に、画面上のどの要素をタップする必要があるかを判断するために、エージェントは Amazon Nova を使用してテキストと画像の両方のコンポーネントを解釈します。 Amazon Nova を使用する理由は、それがマルチモーダルだからです。まずデバイスからダンプされたテキストと構造化データを分析し、そこで見つけられる要素がない場合は、空間画像分析にフォールバックして、画像理解を通じて要素を直接識別します。

Thumbnail 870

Thumbnail 880

要するに、 エージェントが実際に行うことは、4つのステップに要約されます。計画を立て、分析し、行動を起こし、そして確認するのです。実は、 ワークフロー エージェントも全く同じ原則に従っています。既存のワークフローを分析することから始まり、その後、不足しているコンポーネントや必要な変更を特定して、それらを直接適用します。エージェントを構築することは、ヒューマノイド ロボットを作成することと非常に似ています。

Thumbnail 940

本当に必要なのは、文脈を理解するための目と、必要なアクションを実行するための腕です。今日、私たちは MCP のようなアプローチを通じて、その腕を効果的に実装できる時代に生きています。結局のところ、すべてはピースを組み合わせて、すでに存在していたものを再発明することだったのです。では、このプラットフォームが生み出した影響を見てみましょう。

Thumbnail 970

私たちはもう物理的な場所に縛られていません。デジタルノマドワークのように、いつでもどこからでも任意のデバイスにリモートアクセスでき、学習とテストの検証を自動的に実行できます。必要な時に、必要な場所で実行でき、一貫した品質を確保しています。反復的なタスクの代わりに、意味のある仕事に集中できるようになりました。

Thumbnail 990

Thumbnail 1020

次のステップとしては、Figma のようなデザインシステムとの統合を計画しており、エージェントに私たちの製品についてはるかに豊かなコンテキストを提供します。また、アプリで検出されたすべての新しい画面とトランジションを自動的にキャプチャして分析する Atlas マップも構築しています。この Atlas プロジェクトはアプリの神経マップのように機能し、すべてのトランジションをリンクさせて、エージェントをはるかにスマートにします。これが私たちの究極の目標の基盤となります。それは、自然言語とテストシナリオを理解し、あらゆる可能なインタラクションを自律的にテストできるエージェントです。

Thumbnail 1040

いつもそうであるように、これらのテクノロジーは最終的に私たちの仕事と人生をより簡単にしてくれます。コーディングエージェントの助けを借りることで、私はチームを管理し、このようなエンドツーエンドの完全なテックプロジェクトを自分自身で構築して楽しむことができます。本日はお時間をいただき、ありがとうございました。


※ こちらの記事は Amazon Bedrock を利用し、元動画の情報をできる限り維持しつつ自動で作成しています。

Discussion