🥇

「RAGとコスト最適化、AWS活用の最適解はどこにある?」~【aws】今週の人気記事TOP5(2025/08/31)

に公開

【2025/8/31】「RAGとコスト最適化、AWS活用の最適解はどこにある?」今週の人気記事TOP5(2025/08/31)

Amazon S3 Vectorsを試してみた

Fusicのレオナ氏が、Amazon S3 Vectorsを用いたRAG構築を紹介。S3 VectorsはS3にベクトル検索機能を付加し、専用ベクトルストア不要でコスト削減とシンプルな構成を実現。S3内にベクトルバケットとインデックスを作成し、APIでベクトル追加・検索が可能。メタデータによる絞り込みや、OpenSearch/Bedrock Knowledge Basesとの連携も容易。記事では、構築手順、Bedrockとの連携によるベクトル化、クエリ検索の実装例を提示。S3 VectorsはRAG構築をより安価かつシンプルにし、用途に応じた基盤構築を可能にすると結論付けている。

マルチプロダクト構成を支える KANNA のインフラアーキテクチャ

KANNAのインフラアーキテクチャは、AWSを中核としGCPを補完的に活用するハイブリッド構成。複数の独立したサービスで構成され、ECS on Fargateによるコンテナオーケストレーション、Blue/Greenデプロイ、Aurora/PostgreSQLによるデータストア戦略を採用。Datadogによるモニタリング、GitHub ActionsによるCI/CD、多層的なセキュリティ対策、TerraformによるIaCを導入し、コスト最適化も実施。今後はALB間通信の内部化、データレイク整備、グローバルリージョン展開を検討。

AWS Inferentia2とvLLMでLlama 3.2の推論サーバーを構築する手順

AWS Inferentia2上でLlama 3.2の推論サーバーをvLLMを用いて構築する手順を解説。
高コストな大規模インスタンスでモデルをコンパイルし、S3に保存。推論時は安価な小規模インスタンスでコンパイル済みモデルを読み込み、vLLMでホストすることでコスト効率化。
aws-cdk-neuronx-patternsの利用はライブラリのバージョン差異により見送り、EC2上で直接環境構築するアプローチを採用。OpenAI API互換のエンドポイント構築により、SDKやコーディングエージェントとの連携も容易。

AWS Billing and Cost Management MCP serverを早速使ってみた

AWS Billing and Cost Management MCP serverは、自然言語でAWSコスト分析・予測をIDE上で可能にするツール。コスト分析、期間比較、コスト予測、新規ワークロードのコスト推定などの機能を提供する。
記事では、セットアップ手順とClaude Codeでの利用例を紹介。既存環境のコスト分析や期間比較による急増要因の検出、将来コスト予測、Lexのコスト見積もりなどを試した結果、SRE業務の効率化に繋がると結論付けている。今後はカスタムスラッシュコマンドによるコスト監視の自動化を予定。

ALB, Cognito, Lambdaを使ってマルチテナントアプリケーションの開発環境にGoogle認証を導入する

PeopleXでは、マルチテナントアプリケーション開発環境へのGoogle認証導入にあたり、ALBのOIDC認証におけるリダイレクトURI登録問題を解決するため、CognitoとLambdaを用いた認証機構を構築しました。

認証Cookieを独自に発行し、CookieのローテーションをTerraformで自動化。Cognitoを経由することで、GoogleへのリダイレクトURI登録数を減らし、AWS上での設定を完結させています。具体的なCognito設定とLambda関数のサンプルコード、ALB Listener Ruleの設定例も紹介されています。

【2025/8/24】「Bedrock、EFS、LocalStack…AWS活用、次の一手は?」今週の人気記事TOP5(2025/08/24)

組織で使うためのClaude Code Action via Amazon Bedrock(認証・ログ分析・クラウド破産防止)

サイボウズは、組織全体でClaude Code Actionを安全かつ効率的に利用するための基盤を構築しました。Anthropic API契約やGitHub App作成の煩雑さ、セキュリティ・ログ管理の課題、クラウド破産リスクを解決するため、AWS Bedrockを活用し、利用申請の一元化、セキュリティポリシーの強制、実行ログの保存・分析、リポジトリごとのクォータ制御を実現。利用者はkintoneで申請し、AWS認証とGitHub認証を共通基盤で処理。Athenaでログ分析し、コスト計算とクォータチェックを実施。これにより、利用開始のハードルを下げ、セキュリティとコスト管理を強化します。

WEBサーバの一部として Mountpoint for Amazon S3 を使えないか検討したが、Amazon EFS に落ち着いた。

レバテック開発部では、ステートフルなEC2環境におけるファイル共有問題を解決するため、Mountpoint for Amazon S3Amazon EFS を比較検討しました。Mountpoint はS3への高速アクセスに優れる一方、ファイル操作の制限や権限維持の課題が判明。AWSへの問い合わせの結果、ファイル共有と権限管理が必要な今回の要件には Amazon EFS が適していると判断されました。Mountpoint は大規模データ読み込み、EFS は汎用的なファイルサーバ用途に適しています。

LocalStackでAWSをローカル再現してみた

LocalStackはAWSのクラウドサービスをローカルで再現するツールであり、S3、Lambda、DynamoDBなどを模擬的に利用可能。Docker上にLocalStackを構築し、boto3でS3操作を行う構成を紹介。Community版ではデータ永続化がされないため、初期化スクリプトでS3バケットを自動作成。環境ごとの接続先切り替えには、設定ファイルでLocalStackのエンドポイントを指定する方法を採用。認証情報の設定やセキュリティを気にせず、コストゼロでAWSサービスをローカルで扱えるため、開発効率が大幅に改善。

生成 AI のアプリ構築を基礎から学べる書籍を出します

IVRyのAIエンジニアである著者が、生成AIアプリ構築を体系的に学べる書籍を共著で出版。AWSでの経験を活かし、生成AIの概念解説、サービス構築に使えるライブラリや関連サービスの解説、ビジネス導入までを網羅。AIエージェントの歴史やビジネスユースケースの見つけ方にも触れ、読者が生成AIのアップデートにスムーズに対応できるよう構成されている。コーディングエージェント普及の一方で、生成AIアプリを作る人口が増えていない現状を打破したいという思いが込められている。

AWS Lambda×DuckDB×delta-rsによるETLの実装

AWS Lambda上でDuckDBとdelta-rsを用いた軽量ETLの実装を紹介。
Databricks利用時の前処理をLambdaで代替しコスト削減を目指す。
S3イベントをトリガーに、DuckDBでデータ処理、delta-rsでDelta Lake形式に変換しS3へ保存。
大規模データセットやメモリ制約には注意が必要だが、リアルタイムETLやコスト効率の向上が期待できる。
Delta LakeのWriterVersion制約への対応も解説。

【2025/8/17】「Platform Engineering、どこまで最適化できる?」今週の人気記事TOP5(2025/08/17)

AWSのAPI GatewayとCognitoを使ってOAuth認可付きリモートMCPサーバーをつくる

AWSのAPI GatewayとCognitoを活用し、OAuth認可付きのリモートMCPサーバーを構築する手法を紹介。Cognitoの機能不足をAPI Gatewayのマッピングテンプレートで補完し、動的クライアント登録(DCR)やメタデータエンドポイントに対応。これにより、MCP InspectorやVSCode等のクライアントと連携動作するOAuth認可サーバーを、追加のコンピューティングリソースなしで実現。awslabsのmcp-lambda-handlerライブラリを活用することで、MCPツール実装を簡略化。リポジトリで実装を公開し、動作検証も成功。

ウェザーニューズにおけるPlatform Engineering

ウェザーニューズでは、複数のBtoB SaaSプロダクト開発における課題を解決するため、Platform Engineeringを導入。CloudFormationベースのIaCによるインフラ管理、標準化されたCI/CDパイプライン、統合監視・アラート体制、共通IAMポリシーによる多層防御など、セキュリティと運用を標準化。開発者には、統一された開発環境やLambda Layer活用による効率化を提供。これにより、開発効率向上、運用コスト削減、技術的負債の抑制を実現し、各プロダクトチームは顧客価値創造に集中できている。

AWS Glue Python Shell×DuckDB×PyIcebergによるETLの実装

AWS Glue Python Shellで、DuckDBとPyIcebergを用いたETL処理を実装した記事です。S3へのファイルアップロードをトリガーに、Lambda経由でGlue Python Shellを起動、DuckDBでデータ抽出・変換し、PyIcebergでIceberg形式でS3に保存します。Glue Python ShellはLambdaより長時間実行可能で、Glue/EMRより低コストな点がメリットです。依存ライブラリのバージョン管理には注意が必要です。Iceberg形式によるスナップショットやタイムトラベルの利点も強調されています。

【AWS SAM】Error: No changes to deploy. 原因と対処法

AWS SAMでの"Error: No changes to deploy"は、CloudFormationの変更検出によるもので、実際には変更がない、sam build未実行、ファイルハッシュによるスキップ、パラメータのデフォルト値変更などが原因。

主な対処法は--no-fail-on-empty-changesetオプションの使用。samconfig.tomlで設定を永続化、基本的なワークフローの確認も重要。CI/CDではこのオプションがほぼ必須。--force-uploadは最終手段。

Strands AgentsのToolに"Tavily"を活用して高度なWEB検索を行う

Fusicの記事では、Strands AgentsにWeb検索機能を組み込む手段としてTavilyが検証されました。TavilyはLLMとの親和性が高く、リアルタイム検索、コンテンツ抽出、Webクロールなどの機能を提供します。Google CSEと比較して、応答速度が速いという結果が出ています。Tavily APIを利用したToolの作成方法、Strands Agentsへの組み込み手順が解説されています。今後はStrands Agentsの組み込みToolとして提供される予定です。

【2025/8/13】「AWSトレンド最前線、「生成AI活用」波に乗る?」今週の人気記事TOP5(2025/08/13)

AWS LambdaでRemote MCP Serverをほぼ無料でホスティングする

Claudeの記憶を保持するRemote MCP(Memory Context Protocol)サーバーを、AWS Lambdaを用いてほぼ無料でホスティングする方法を解説。イベント駆動型であるLambdaの特性と無料枠を活かし、DynamoDBを組み合わせることで個人利用なら十分な性能を維持できる。AWS公式のmcp_lambda_handlerライブラリを使用し、ローカルMCPとのアーキテクチャの違いを吸収。Function URLでLambda関数を公開し、簡易的なAPIキー認証を実装。これにより、デバイス間での一貫した体験と運用負荷の軽減を実現。

AIにどこまで任せられる? "どうせ無理"と諦めていたアプリ開発を実現した、生成AI活用のコツ

NTTデータの奥村氏が、ChatGPTとGeminiを活用し、診療科に特化した病院検索Webサイト「Med-Finder」を開発。AWS CDK(Python)でバックエンドAPIを1日、Next.jsでフロントエンドを3日で構築した。

バックエンドでは医療情報ネットのオープンデータをDynamoDBに格納し、ジオハッシュと診療科目をキーに検索を最適化。フロントエンドは絞り込み検索を可能にし、スマホ表示にも対応。

AI活用で開発速度が向上する一方、セキュリティ対策や利用規約の表示など、開発者側の知識とチェックも重要。AIは得意なことと不得意なことがあり、行き詰まった際は別のAIに相談することも有効。

Amazon Pinpointからのメール配信基盤移行 Vol.1 データ移行における安全なバックアップ

NTTデータ瀧川氏の記事は、Amazon Pinpointのサポート終了に伴い、Amazon Connectへの移行におけるデータバックアップ方法を解説する。

Pinpointのコンソールエクスポート機能では不十分なセグメント定義やキャンペーン設定を、AWS CLIとAPIを活用しJSON形式でS3にバックアップする手順を紹介。
具体的なCLIコマンド、S3バケットポリシー、IAMロール設定例を示し、セキュアな環境でのデータ移行を推奨する。
次回は、バックアップデータをAmazon Connectへ移行する際の課題と解決策を解説予定。

【小ネタ】AWSのIPアドレス調査ツール

AWSのIPアドレス調査を効率化するPowerShellスクリプトを紹介。
1つ目は、AWS公式のIP範囲情報(ip-ranges.json)を基に、リージョンとサービスを選択してIP範囲をCSV出力するツール。
2つ目は、IPアドレスを入力すると、該当するAWSのサービスとリージョンを特定するツール。
セキュリティチェック時のホワイトリスト作成や接続先特定に役立つ。

ARNでリソースページに飛ぶURL

AWSマネジメントコンソールでARNからリソースページへの直接リンクがない問題を、著者はAWS内部API GET https://console.aws.amazon.com/go/view?arn={ARN値} を発見し解決しました。このAPIを利用することで、ARNをURLパラメータとして渡すことで、対応するリソースページへ遷移できます。ブラウザの検索エンジンにこのURLを登録し、ショートカットキーと組み合わせて使うことで、ARNからリソースページへのアクセスを効率化できます。

【2025/8/3】「AWS、コスト、Terraform、データ活用...次に注目すべきは?」今週の人気記事TOP5(2025/08/03)

MCPツールを用いた自然言語でのAWSコスト分析

AWSコスト分析の課題に対し、自然言語でAWSのコスト分析を可能にするMCPツールを用いた解決策が紹介されています。
CURの分析を、AI搭載エディタCursor、DuckDBベースのmcp-server-motherduck、Vega-Liteベースのmcp-vegalite-serverを活用し、自然言語プロンプトからDuckDBクエリ発行、コスト最適化案の生成、グラフ可視化を自動化します。
これにより、分析基盤構築の工数やクエリ実行コストを削減し、詳細なコスト分析と最適化を容易に行えます。

CloudWatch ログを Data Firehose 経由で Iceberg テーブルに配信する

CloudWatchログをData Firehose経由でS3 TablesのIcebergテーブルにニアリアルタイム配信する構成を紹介。Data FirehoseでログをS3 Tables(Iceberg)に直接書き込み、Snowflakeから参照可能にする。
実装では、S3 Tablesテーブル、データ変換Lambda関数、FirehoseストリームをTerraformで構築。CloudWatchログをFirehoseに送り、Lambdaでデータ変換後Icebergテーブルへ。最後にSnowflakeからIceberg RESTカタログ統合でテーブルを作成し、データ参照。
ETLパイプライン構築なしに、Snowflakeへのニアリアルタイムデータ取り込みが実現可能。

誤ってIAMロールを大量削除した話

WealthNaviのステージング環境でIAMロール大量削除が発生。原因はTerraformのstateファイルkey変更見落としによる誤apply。ECS, CloudWatch Logs, Lambda, S3等に影響が出たが、Terraform再作成等で復旧。対策としてCI/CDパイプライン未整備、PRレビュー不足を挙げ、GitHub Actions導入、PRテンプレート改善、AIレビュー導入を実施。長期化した場合のリスクも考慮し、ノンブロッキングモード採用等を検討。再発防止と開発者全体のTerraform安全利用を目指す。

service-defを使わずにecspressoとTerraformを併用する

TOKIUMの對馬氏の記事では、ecspressoとTerraformを併用する際の課題と解決策を紹介。ecspressoはECSのアプリケーションデプロイに特化しているが、Terraformとの連携でサービスのセキュリティグループやサブネットIDの動的な参照が課題となる。公式推奨のtfstate参照機能が既存構成で困難なため、著者はservice-def.jsonを使用せず、Terraformでサービスを管理する方法を採用。タスク定義の二重管理とecspresso runが使えなくなるデメリットはあるものの、現状問題なく運用できている。

Amazon DataZone 超概要

Amazon DataZoneは、AWS、オンプレミス、サードパーティのデータソースを統合し、データカタログ、アクセス管理、ビジネス用語集により、組織全体のデータ活用を促進するデータ管理サービスです。ドメインを最上位とし、プロジェクト、環境、ビジネスデータカタログ、サブスクリプションなどの主要コンポーネントで構成。データソースからアセットを生成し、ビジネス用語集やメタデータフォームで意味を統一。データポータルを通じて、ユーザーはセルフサービスでデータを発見、共有、分析できます。

CareNet Engineers

Discussion