🥇

「RAGシステム、自作してみませんか?そのメリットとは?」~【googlecloud】今週の人気記事TOP5(2025/12/28)

に公開

「RAGシステム、自作してみませんか?そのメリットとは?」今週の人気記事TOP5(2025/12/28)

「手作り RAG システム」で RAG の仕組みを学び直す

「手作り RAGシステム」では、マネージドサービスを使わずPythonとGemini APIでRAGの仕組みを解説。ドキュメントをLLMで要約・キーワード抽出してからベクトル化することで、チャンク分割不要でロングコンテキストを活用した高精度な検索を実現。さらに、ユーザープロファイルや過去履歴を基にしたパーソナライズ回答も実装。実運用では、ベクトル検索エンジン、データ更新パイプライン、セキュリティ、品質評価などが重要となる。

Vertex AI Vector Search 2.0 登場 ―― ANN 特化から「データストア統合型」の包括的な検索基盤へ

Vertex AI Vector Search 2.0 は、ANN 特化からデータストア統合型へ進化。ベクトルとドキュメントを一体管理し、Query API(データ取得・フィルタリング)と Search API(セマンティック・テキスト・ハイブリッド検索)を提供。開発者体験向上で、インフラ管理・チューニング・ベクトル化も自動化。RAG や多様な検索基盤として活用可能。

非同期処理の設計原則と GCP パターン集 !

本記事は、GCPにおける非同期処理の設計原則と実践パターンを解説。非同期処理の必要性判断、ジョブの短さ・シンプルさ、冪等性、並行性、リトライ戦略などの原則を説明。GCPのCloud Tasks, Pub/Sub, Eventarc, Schedulerの特徴と使い分け、さらにWeb APIの重い処理非同期化、複数サービスへのイベント通知、定期バッチ処理など、11のアーキテクチャパターンを紹介。運用上の監視ポイントも解説し、GCPでの非同期処理設計の理解を深める。

Terraformモジュール設計の難しさとどう向き合うか

Terraformモジュール設計の難しさは、変更の増大、認知負荷、未知の未知といった複雑性に起因します。これに対し、低結合・高凝集を目指し、機能的凝集を意識することが重要です。また、Deep Modulesのように意味のある抽象化を行い、YAGNIの原則に従い、シンプルさを保つことが推奨されます。モジュール化の判断基準は、再利用性、認知負荷軽減、変更頻度、独立性を考慮し、複雑性増加を上回るメリットがあるかどうかに集約されます。

3大クラウド全冠者が送るAI時代にふさわしい(?)クリスマスプレゼント

3大クラウド(AWS, Azure, Google Cloud)のAI系資格を、「AIリテラシー」「AI/MLエンジニア」「データエンジニア/データサイエンティスト」の3カテゴリに分類・比較。各クラウドの入門・応用・専門資格を紹介し、目的に応じた資格取得を推奨。AI時代に備え、各ベンダーがAI基礎~応用まで幅広く資格を提供している現状をまとめている。

「AIエージェント開発、非エンジニアでも爆速化。」今週の人気記事TOP5(2025/12/21)

iOSアプリのリリース作業を自動化した話

iOSアプリのリリース作業を自動化するため、Slackスラッシュコマンドを起点とした仕組みを構築。SlackコマンドでGASが起動し、Cloud Functions経由でGitHub Actionsをトリガー。GitHub Actionsはリリースブランチ作成、バージョン更新、PR作成を行い、Xcode Cloudがテスト、TestFlightへのアップロード、配布用アプリアップロードまでを実行。これにより、ヒューマンエラー削減、作業時間短縮、緊急対応時の負担軽減を実現した。

PR単位で動作確認がしたい!

Ubieは、プルリクエスト (PR) ごとに独立した動作確認環境「preview環境」を構築しました。これにより、開発者の動作確認のボトルネックを解消し、開発効率を向上させています。

技術内容:

  • Kubernetesのマルチクラスタ構成を拡張し、PRごとに独立したpreviewクラスタを作成。
  • HTTPヘッダー (ubie-preview) による接続先Podの選択方式を採用。
  • Google CloudのIAP (Identity-Aware Proxy) を利用したアクセス制御。
  • GitHub PRへのコメントによる自動化されたpreview環境作成フロー。

この仕組みにより、開発者は容易に最新コードの動作確認ができ、チーム内での成果物共有もスムーズになりました。

按分は一回だけ、集計は何度でも - GCPコスト按分機構の設計進化

ユビーはGCPコスト按分機構を進化させ、経営企画向け(事業別)と開発チーム向け(マイクロサービス別)の双方でコストを把握可能にした。以前はカテゴリ毎の按分で限界があったが、「按分は一回だけ、集計は何度でも」をコンセプトに、Billing Exportのレコード単位で按分する方式へ転換。これにより、経営と開発の「コスト」という共通言語を築き、迅速な意思決定と開発スピード向上を目指す。

未経験から1.5ヶ月でGoogle Cloud 11冠を達成したので振り返る

NTTデータ社員が、Google Cloud認定資格11冠を1.5ヶ月で達成した経験を共有。短期間で資格を取り続ける習慣として、「仲間探し」「積極的な受験予約」「自宅受験の活用」「社内イベント・資格支援制度の利用」「生成AIの活用」を挙げている。特に、資格取得は「習慣づけ」が重要であり、意志の強さではなく良い習慣を作ることが継続の鍵だと結論づけている。

ADK Visual Builder と Gemini Enterprise で実現する「全社員が使える」エージェント開発

ADK Visual Agent Builder と Agent Starter Pack (ASP) を用いることで、非エンジニアでも直感的なGUIで複雑なAIエージェントを爆速開発できます。競合調査エージェントの例では、並列・順次・反復処理を組み合わせたマルチエージェントシステムをGUIで構築し、Vertex AI Agent Engineにサーバーレスデプロイ。最後にGemini Enterpriseに登録することで、全社員が普段利用するチャットUIからアクセス可能になります。この「開発→運用→配信」の一気通貫エコシステムが、Google Cloudの強みです。

「Cloud Runコールドスタート、Vertex AI移行、ETLの最適化:最新トレンドを掴む!」人気記事

Node.js のコンパイルキャッシュで Cloud Run のコールドスタートを速くする

Cloud Run のコールドスタート時間を短縮するため、Node.js v22.1.0 から追加されたコンパイルキャッシュ機能を利用する方法を紹介します。この機能は、JavaScriptモジュールのパース・リンク・コンパイル結果をディスクに永続化し、次回以降の起動で再利用することで、起動時間を大幅に改善します。OCIイメージビルド時にキャッシュを生成し、Cloud Run へデプロイすることで、最大40秒かかっていた起動時間が15秒程度まで短縮された事例が紹介されています。

【速報ブログ】Gemini API のレート制限変更について

Gemini API のレート制限が大幅に厳格化され、無料枠での利用が制限されました。ビジネス利用においては、Google Cloud の Vertex AI への移行が推奨されます。Vertex AI は、IAMによる詳細な権限管理、入力データが学習に利用されないというデータプライバシー保証など、エンタープライズレベルのセキュリティとガバナンスを提供します。個人開発者向けの Gemini API とは異なり、Vertex AI は企業のコンプライアンス要件を満たすための最適な選択肢です。

Cloudflare WorkersログをR2+Queue+digdag+embulk+BigQuery で安価にETLする方法

Cloudflare Workersのログを、Enterpriseプランなしで安価にBigQueryへ転送するETLパイプラインを構築しました。
「Workers → Queue → R2 → digdag/embulk → BigQuery」の構成で、サーバーレスに近い形で約$400/月で実現。
WorkersはログをJSONでQueueに送り、Queue ConsumerがR2に蓄積。その後、Cloud Run Jobsでdigdag/embulkがR2からログを読み込み、BigQueryへロードします。
これにより、ログのロスなく収集、柔軟な拡張、高速クエリが可能となります。
「1行も失いたくない」場合はEnterpriseプランが推奨ですが、コストを抑えつつ実用的なログ基盤を構築したいチームに適しています。

Google Cloud Partner Top Engineer 2026 Fellow までにやったこと

NTTデータの近藤氏がGoogle Cloud Partner Top Engineer 2026 Fellowに選出された経験に基づき、Fellowを目指すための具体的な取り組みが語られています。Fellow選出には、Google Cloud認定の全プロフェッショナル資格取得、質と量を両立させたブログ投稿や社外発信による普及貢献、大規模案件やソリューション開発への参画、そしてGoogle Cloudビジネス拡大への情熱を示すことが重要です。特に、自身の貢献を定量的に示すこと、そして業務外でも実施可能な資格取得や情報発信でアピールポイントを稼ぐことが強調されています。

Google Cloudのメンテナンスモードをインフラレイヤで実現する:Cloud Armor + URL Mapsの IaC 活用術

TimeTreeは、Google Cloud環境でメンテナンスモードをインフラレイヤで実現するため、Cloud ArmorとURL MapsをTerraformで活用する手法を導入した。特定のIPアドレス以外へのアクセスをCloud Armorで502エラーにし、URL Mapsのカスタムエラーレスポンス機能でCloud Storage上の固定メンテナンス画面(503エラー)にルーティングすることで、アプリケーションの変更なしにメンテナンスモードを切り替え可能にした。これにより、デプロイ依存性を排除し、運用コストを削減した。

【2025/12/12】「Gemini API変更であなたのGen AI開発戦略は見直し必要?」人気記事TOP5(2025/12/12)

Node.js のコンパイルキャッシュで Cloud Run のコールドスタートを速くする

Cloud Run上のNode.jsアプリのコールドスタートを短縮するため、Node.js v22.1.0以降のコンパイルキャッシュ機能を活用。ビルド時にNODE_COMPILE_CACHEを設定し、warmup.jsでエントリポイントを読み込むことで、コンパイル済みモジュールをディスクに永続化。これにより、ランタイムでのparse/link処理をスキップし、起動時間を最長40秒から15秒程度に大幅改善。FaaS全般に応用可能。

Cloudflare WorkersログをR2+Queue+digdag+embulk+BigQuery で安価にETLする方法

Cloudflare Workersログの安価なBigQuery転送のため、Workersで生成したログをQueue経由でR2に蓄積。GCPではCloud Run Jobs上でdigdag+embulkを毎時実行し、R2のJSON配列ログを展開・変換しBigQueryへETLするパイプラインを構築した。結果、Enterpriseプラン不要で月額約$400で全リクエストログを集約し、高速クエリとほぼサーバーレスかつ自動回復性を持つ堅牢な運用を実現。

【速報ブログ】Gemini API のレート制限変更について

Gemini APIの無料枠が大幅制限(例: 250回/日→20回/日)され、有料アカウント紐付けが必須となり、開発初期段階からの技術選定が重要になった。ビジネス用途では、セキュリティ(IAMによる権限管理)や、入力データがモデル学習に利用されないデータプライバシー保護の観点から、Google CloudのVertex AI APIへの移行が強く推奨される。本番運用を見据え、企業のコンプライアンス要件を満たす最適な選択肢だ。

Google Cloud Partner Top Engineer 2026 Fellow までにやったこと

NTTデータの近藤氏がGoogle Cloud Partner Top Engineer 2026 Fellowに選出。その秘訣は、全プロフェッショナル認定資格の網羅的取得、ブログ(14本、最大2万PV)や勉強会での技術普及貢献。加えて、Google Cloud案件での利用拡大やコスト削減、新プロダクト活用といった実績を定量的に示し、Gen AI Technical Expert Badge取得も加点された。業務と自己研鑽両面で高い技術貢献が評価された。

Google Cloudのメンテナンスモードをインフラレイヤで実現する:Cloud Armor + URL Mapsの IaC 活用術

TimeTreeはGCP環境で、アプリケーションのデプロイなしにインフラレイヤでのメンテナンスモードを実現。Cloud Armorで特定IP以外からのアクセスを502で拒否し、URL Mapsのカスタムエラーレスポンスでその502を503に変換して、Cloud Storage上の固定メンテナンスページへルーティングします。この仕組みはTerraformのIaCでlocal.maintenance_mode変数により動的に構成可能。ChatGPTとの協業で、この効率的なアプローチを発見しました。

CareNet Engineers

Discussion