🥇

「ローカルLLMとAIエージェント、次はどう活用する?」~【python】今週の人気記事TOP5(2025/10/05)

に公開

【2025/10/5】「ローカルLLMとAIエージェント、次はどう活用する?」今週の人気記事TOP5(2025/10/05)

GPUなしローカルでも高速・高精度なOCRができるOnnxOCRが凄い

PaddleOCRをベースにしたOnnxOCRは、ONNX Runtimeの活用により、高速かつ高精度なOCRをGPUなしの環境でも実現するライブラリ。PaddleOCRと比較して最大5倍の推論速度。EasyOCR,PaddleOCR,OnnxOCRの3つを比較検証した結果、特に情報量の少ない画像や変形した画像の認識において、OnnxOCRは圧倒的な速度と文字認識精度を示した。Apacheライセンスで商用利用可能。

AI社内報の作り方:Slack×OpenAIで社内ニュースを自動生成

PeopleXの坂津氏が、SlackとOpenAIを活用したAI社内報の作成方法を公開。
Slackのパブリックチャンネルから「今週の注目ニュース」を自動生成し、Slackに投稿するボットで、情報収集の効率化、バイアスのない情報共有、ナレッジの可視化、組織エンゲージメント向上に貢献。
GitHubリポジトリを公開し、導入はリポジトリのフォーク、GitHub Secretsの設定、Slack Appの作成の3ステップ。
GPT-5を利用し、コストは最大約$1.44/回。
GitHub Actionsによる定期実行やLLMへの入力トークン削減で低コスト運用を実現。

Ollama Web Search登場!ローカルLLM gemma3と組み合わせて"完全ローカルAIニュースデスク"を作ってみた!

Ollamaの新機能Web SearchとローカルLLM gemma3を組み合わせ、AIニュースデスク「AI News Daily」を構築した事例を紹介。Ollama Web Searchで最新AIニュースを検索、記事本文を解析・要約し、gemma3でジャーナリスト風の記事を自動生成する。REST APIとSDKを使い分けた検索クライアントと、gemma3に役割を与えるプロンプトがポイント。Ollama Web Searchにより、精度の高い最新情報取得が可能になり、リアルタイムアプリケーションへの活用が期待できる。

AWS製AIエージェントOSS Strands Agentsの主要機能ハンズオン

AWS製のOSS AIエージェントSDK「Strands Agents」の主要機能をハンズオン形式で解説。

基本概念: Agent Loop (入力→LLM判断→ツール実行→結果返し)

主要機能:

  • エージェント: プロンプト設定、マルチモーダル対応、多様なモデルプロバイダ対応 (Bedrock, OpenAI等)
  • セッション管理: ローカル、S3、カスタムDB (SQLite) への保存と、会話履歴の保持戦略 (Null, SlidingWindow, Summarizing)
  • Hooks: エージェントライフサイクルにおける処理の追加
  • 構造化出力: Pydanticモデルによる出力形式の固定
  • Tools: Python関数やMCP (Model Context Protocol) ツールによる機能拡張、ツール選択の仕組み
  • マルチエージェント: Agents as Tools, Swarm, Graph, Workflowパターンによる複雑なタスク解決

これらの機能を活用し、少ないコード量で柔軟なAIエージェントを構築できることを示唆。詳細な実装例はGitHubリポジトリを参照。

PyCon JP 2025 In 広島 参加レポート【Goldスポンサー協賛 / セッション登壇】

Recustomer社がPyCon JP 2025にGoldスポンサーとして協賛し、5名のエンジニアが登壇。スポンサーブースでは好きなPythonライブラリのアンケートを実施し、Flaskが1位。

セッションでは、CPython内部構造、イミュータブル設計、フロントエンドエンジニアから見たPython、型チェッカー進化論、Streamlitを用いたSaaSアーキテクチャ等、多岐にわたるテーマで発表が行われた。各講演では具体的な設計や事例紹介に加え、設計思想や背景にある理由を言語化し、参加者が持ち帰れる普遍的な「型」を意識した内容が特徴。

CareNet Engineers

Discussion