🥇

「AIエージェント開発、次の一手は?」~【python】今週の人気記事TOP5(2025/10/26)

に公開

【2025/10/26】「AIエージェント開発、次の一手は?」今週の人気記事TOP5(2025/10/26)

uv × DockerでのPython開発環境構築方法

松尾研究所では、高速なPythonパッケージ管理ツールuvを推奨しており、Docker環境でのuv利用方法を3パターン紹介しています。

  1. 公式uv+Pythonイメージ(推奨):Dockerfileがシンプルになる
  2. 公式uvイメージ:ベースイメージを自由に選択可能
  3. 公式インストーラ:開発環境との統一性、何をしているか一目で分かる

公式uv+Pythonイメージが推奨。ADDコマンドでインストーラをダウンロードする方法は、過去の課題が解消され現在では推奨。社内ではcookiecutterテンプレートも整備されている。

YouTubeの良いレスバトルを自動抽出するプログラムを作ってみた

YouTube APIと感情分析モデルで、高評価が多いレスバトルを自動抽出するプログラムを開発。動画コメントをAPIで取得後、BERTを用いた感情分析でネガティブなコメントを特定。最初のコメントより返信への評価が高いものを抽出するロジックを実装。しかし、抽出結果はネガポジ判定の精度に課題が残る。今後は感情分析の精度向上が課題。

沖縄Kaggler会を開催しました

2025年10月、沖縄Kaggler会が開催。
勉強会では、Google Colabの進化、Coding Agentによる機械学習コンペの可能性と課題、Kaggle経験を活かした副業、遺伝的アルゴリズムによるLLMプロンプト最適化手法GEPA(DSPyライブラリも紹介)、Vibe Kagglingと基盤モデルのKaggle事例が発表された。
GEPAではSFTと同等以上の精度向上が期待できるとのこと。
スポンサーLTでは、ちゅらデータとカレーちゃんのAI道場が紹介された。
参加者から好評で、第2回の開催も検討されている。

Microsoft Agent Frameworkのワークフローを見てみる

Microsoft Agent FrameworkのWorkflowsは、AIエージェントとカスタムロジックを組み合わせた柔軟なワークフローを構築できる有向グラフ構造です。Executor(処理単位)、Edge(メッセージフロー)、Workflows(グラフ全体)を組み合わせて構築します。Edgeは条件分岐やファンアウト/ファンインなど多様なパターンに対応。ワークフローの実行はストリーミング/非ストリーミングに対応し、実行状態を監視するEventも利用可能です。ExecutorにはAIエージェントを統合でき、AgentExecutorを使用するか、カスタムExecutor内でAIエージェントを実行できます。Shared Stateによるワークフロー横断的な情報共有も可能です。

Snowflake 初学者におすすめの Platform Training と Tasty Bytes!

Snowflake初学者向けに、Platform TrainingとTasty Bytesという2つの無料コンテンツが推奨されています。Platform Trainingでは、SQL/Pythonの知識を前提に、Snowflakeの機能、RBAC、Cortex AIなどを網羅的に学習でき、SnowPro Associateの無料バウチャーも提供されます。Tasty Bytesは、架空のデータを用いて、タイムトラベル、半構造化データ、マーケットプレイスなど、Snowflakeの基本的な操作を体験できます。どちらもハンズオン形式で学べますが、Platform Trainingは内容が多いため、概要を把握後、復習が推奨されています。

【2025/10/19】「サーバレス、グラフデータ…Pythonトレンド最前線、次は?」今週の人気記事TOP5(2025/10/19)

yomitokuで作る日本語OCR Webアプリ【Flask + TypeScript】

日本語OCRライブラリ「yomitoku」を用いたWebアプリ構築に関する記事。Flask(Python)とTypeScript(Vite)で実装し、Docker Composeで開発環境を構築。yomitokuは日本語に特化し、段落・単語レベルでテキストを抽出可能。EasyOCRとの比較で精度優位性を示す。実装では初期化処理、画像形式変換、データ構造の活用が重要。セキュリティ対策も実施。yomitokuは個人利用・研究利用は無償だが、商用利用は有償ライセンスが必要。

「著者陣に聞く!PythonではじめるMCP開発入門」イベントレポート

Findy主催のイベント「PythonではじめるMCP開発入門」のレポート。李碩根氏がMCPの基礎を解説し、からあげ氏がMCPのコンテキストエンジニアリング活用法と便利ツールを紹介。渡邊拓夢氏はクロスワードを解くMCPサーバー開発事例を通して、MCPサーバーの開発・活用における工夫点を解説した。イベントではMCPに対する深い質問が多く、関心の高さが伺えた。書籍「PythonではじめるMCP開発入門」も紹介。

uvコマンドチートシート

uvは、Rust製の高速なPythonパッケージマネージャーで、pip, poetry, venvなどの機能を統合します。pyproject.tomlで依存関係を管理し、uv lockで環境を再現、グローバルキャッシュでパッケージを再利用します。主なコマンドとして、プロジェクト作成(uv init)、依存関係管理(uv add, uv remove, uv lock, uv sync)、コマンド実行(uv run)、パッケージビルド/公開(uv build, uv publish)、ツール管理(uv tool install, uv tool run)、Pythonバージョン管理(uv python list, uv python install)があります。uv runuv tool runの使い分けが重要です。

Prometheus + Step Functions + Lambdaで構築するサーバレスオンコール基盤

ネクストビートは、全員CTO体制のもと、エンジニア全員参加のオンコール体制を構築。Prometheusで死活監視とリソース監視を行い、AlertManagerでアラートを検知、API Gateway経由でStep Functionsを起動。Step Functionsは、severityに応じてLambdaを順次実行し、Twilio APIを用いた電話通知とSlack通知を実施。電話が繋がるまでDynamoDBの電話番号リストを基にループする。SaaSに依存しないオンコール基盤の構築例として紹介。

地理空間データを異種GNN向けのグラフ表現に変換するPythonライブラリを作ったらバズった

佐藤氏が開発したPythonライブラリcity2graphは、地理空間データを異種グラフ表現に変換し、GNNでの利用を容易にします。GeoPandas、NetworkX、PyTorch Geometric間のデータ変換を統合し、都市形態、交通ネットワーク、モビリティなどの多様なデータソースに対応。特に、異種グラフの構築とメタパスによる拡張に強みを持ちます。エンドツーエンドの例として、建物の価格予測を行うGNNモデルの学習も紹介。GitHubで公開され、多くのStarを獲得しています。

【2025/10/12】「AI開発、Difyとエージェントでどこまでできる?」今週の人気記事TOP5(2025/10/12)

プロンプトエンジニアリングを終わらせるDSPy

DSPyは、手動プロンプトエンジニアリングを排除し、プロンプトを訓練可能なパラメータとして最適化するフレームワーク。
記事では、文章をナルト風に変換するタスクを例に、DSPyの最適化プロセスを解説。
特に、外部LLMによる評価とフィードバックを活用するGEPAアルゴリズムにより、プロンプトが改善され、より適切な出力を得られることを示している。
PyTorchのような柔軟性はないものの、Kerasのような使いやすさを持ち、データ所有者が優位になる可能性に言及。

誰でも書けるスクリプト言語は、immutable な配列を提供すればよかった

PythonやJavaScriptの配列操作における参照渡しによる意図しない挙動(一方の変数の変更が他方に影響)を指摘。C++のdeep copyは安全だがコストがかかる。Rustは所有権によりコンパイル時にエラーを検出できるが学習コストが高い。ScalaのimmutableなVectorは安全で扱いやすい。結論として、「誰でも書けるスクリプト言語」は標準でimmutableな配列を提供すべきだった。Swift, R, PHPもcopy on writeの仕組みで同様の問題を回避できると追記。

Sora 2 API を触ってみた

OpenAI DevDay 2025で発表されたSora 2 APIを使い、Pythonで動画生成を試した。Sora 2とSora 2 Proの2つのモデルがあり、APIは非同期処理。動画生成後、ダウンロードURLから動画を取得。サムネイルやスプライトシートもダウンロード可能。参照画像を用いた生成や、既存動画のリミックスも可能。Webhookによる完了通知や生成履歴の確認・削除機能も搭載。生成には秒数ごとの課金があり、プロンプト設計が重要。生成コンテンツには年齢制限や著作権に関する制限がある。

Microsoft Agent Frameworkをためしてみた(python)

Microsoft Agent Frameworkは、Semantic KernelとAutoGenを統合したエージェント開発フレームワークです。
エンタープライズシステムの構築を容易にするため、オープンスタンダード、研究から運用までのパイプライン、コミュニティ主導の拡張性、エンタープライズ対応の4つの主要機能を備えています。
Pythonでの実装例として、Azure OpenAI ChatCompletion Agentを利用したチャット、画像認識、ツール連携、MCPツール利用、コンカレントオーケストレーションが紹介されています。
将来的にはMicrosoft 365 Agents SDKとの連携も予定されています。

現場で使える!Dify x Pythonハイブリッド開発実践!

Sapeet社では、生成AIプロジェクトでDifyとPythonのハイブリッド開発を実践。DifyでAIワークフローを構築し、PythonからAPI呼び出しすることで、プロンプト変更をDifyで迅速に行い、データ処理やUI構築をPythonで柔軟に実現。

Difyの環境構築では、クラウド版からセルフホスト版への移行で安定性を向上。ワークフロー開発では、Geminiを用いたレシート文字起こし処理を例に、処理の集約化、構造化出力の活用、コスト把握の重要性を解説。

DifyのワークフローはDSL形式でエクスポートし、Gitでバージョン管理。AI開発と柔軟なシステム構築を両立する手法を紹介。

【2025/10/5】「ローカルLLMとAIエージェント、次はどう活用する?」今週の人気記事TOP5(2025/10/05)

GPUなしローカルでも高速・高精度なOCRができるOnnxOCRが凄い

PaddleOCRをベースにしたOnnxOCRは、ONNX Runtimeの活用により、高速かつ高精度なOCRをGPUなしの環境でも実現するライブラリ。PaddleOCRと比較して最大5倍の推論速度。EasyOCR,PaddleOCR,OnnxOCRの3つを比較検証した結果、特に情報量の少ない画像や変形した画像の認識において、OnnxOCRは圧倒的な速度と文字認識精度を示した。Apacheライセンスで商用利用可能。

AI社内報の作り方:Slack×OpenAIで社内ニュースを自動生成

PeopleXの坂津氏が、SlackとOpenAIを活用したAI社内報の作成方法を公開。
Slackのパブリックチャンネルから「今週の注目ニュース」を自動生成し、Slackに投稿するボットで、情報収集の効率化、バイアスのない情報共有、ナレッジの可視化、組織エンゲージメント向上に貢献。
GitHubリポジトリを公開し、導入はリポジトリのフォーク、GitHub Secretsの設定、Slack Appの作成の3ステップ。
GPT-5を利用し、コストは最大約$1.44/回。
GitHub Actionsによる定期実行やLLMへの入力トークン削減で低コスト運用を実現。

Ollama Web Search登場!ローカルLLM gemma3と組み合わせて"完全ローカルAIニュースデスク"を作ってみた!

Ollamaの新機能Web SearchとローカルLLM gemma3を組み合わせ、AIニュースデスク「AI News Daily」を構築した事例を紹介。Ollama Web Searchで最新AIニュースを検索、記事本文を解析・要約し、gemma3でジャーナリスト風の記事を自動生成する。REST APIとSDKを使い分けた検索クライアントと、gemma3に役割を与えるプロンプトがポイント。Ollama Web Searchにより、精度の高い最新情報取得が可能になり、リアルタイムアプリケーションへの活用が期待できる。

AWS製AIエージェントOSS Strands Agentsの主要機能ハンズオン

AWS製のOSS AIエージェントSDK「Strands Agents」の主要機能をハンズオン形式で解説。

基本概念: Agent Loop (入力→LLM判断→ツール実行→結果返し)

主要機能:

  • エージェント: プロンプト設定、マルチモーダル対応、多様なモデルプロバイダ対応 (Bedrock, OpenAI等)
  • セッション管理: ローカル、S3、カスタムDB (SQLite) への保存と、会話履歴の保持戦略 (Null, SlidingWindow, Summarizing)
  • Hooks: エージェントライフサイクルにおける処理の追加
  • 構造化出力: Pydanticモデルによる出力形式の固定
  • Tools: Python関数やMCP (Model Context Protocol) ツールによる機能拡張、ツール選択の仕組み
  • マルチエージェント: Agents as Tools, Swarm, Graph, Workflowパターンによる複雑なタスク解決

これらの機能を活用し、少ないコード量で柔軟なAIエージェントを構築できることを示唆。詳細な実装例はGitHubリポジトリを参照。

PyCon JP 2025 In 広島 参加レポート【Goldスポンサー協賛 / セッション登壇】

Recustomer社がPyCon JP 2025にGoldスポンサーとして協賛し、5名のエンジニアが登壇。スポンサーブースでは好きなPythonライブラリのアンケートを実施し、Flaskが1位。

セッションでは、CPython内部構造、イミュータブル設計、フロントエンドエンジニアから見たPython、型チェッカー進化論、Streamlitを用いたSaaSアーキテクチャ等、多岐にわたるテーマで発表が行われた。各講演では具体的な設計や事例紹介に加え、設計思想や背景にある理由を言語化し、参加者が持ち帰れる普遍的な「型」を意識した内容が特徴。

CareNet Engineers

Discussion