🐕

2025年 新たに触れた技術雑感

に公開

自分が2025年にエンジニアとして新たに触れた技術と、その雑感をまとめます。

画像処理

DINOv3

https://github.com/facebookresearch/dinov3

画像検索システムを構成するのに使っています。別記事で書いたように、ガッツリfine-tuningしています。自分のタスクではViT-LのパフォーマンスがS,Bと比べ微妙で(pretrain、fine-tuningともに)、ViT-Bを使うことが多いです。論文を見るともっと精度が出そうなものなんですが。

2026年は、検索以外のタスクでも使っていきたいです。

SAM3

https://github.com/facebookresearch/sam3

前処理として使用しています。SAM, SAM2では矩形や座標などの空間プロンプトによって指定したオブジェクトをセグメントするものでしたが、SAM3では大きく変わり、言語プロンプトで指定することが可能となりました。検出漏れは割とありますが、Precisionは高いように思います。

ただし処理コストはかなり大きいため、画像認識の前段などオンライン処理には不向きだと思います。オフラインでの画像処理、画像データのクレンジングや、背景差し替え、学習データ整備の支援など、「遅くてもよい」「検出漏れがあってもよい」タスクに使うことが多いです。

LightGlue

https://github.com/cvg/LightGlue

3年前の技術ですが、その間キーポイントマッチングする機会がなく触るのを先延ばしにしていました。実際触ってみると、論文の数値から想像していた以上の体感精度が得られており、もっと早く触っていればよかったと思います。

kaggleではALIKED+LightGlueが鉄板だと思いますが、SIFT+LightGlueでも多くのタスクでは十分だと思います。

コーディングAI

Claude Code

現在のメインです。2025年はClaude CodeとCodexと何度も行ったり来たりしていましたが、2025後半あたりからこちらがメインに固まりました。

ガッツリとした開発よりも、フットワーク軽く検証プログラムを作るようなタスクが多いため、処理時間は正義ですね。MCPは最低限しか使っていません。

Codex CLI

一時期メインで使っていましたが、現在はサブでの利用です。主にはレビュー用途ですが、簡単に画面を作りたい場合にClaude Codeと並列に作らせて、デザインが好みの方をベースとして採用する、といった使い方もしています。

対話型AI

ChatGPT

コーディング以外の用途のメインです。最近ではGeminiの評判がよく自分も触ることは多いですが、自分の用途ではどちらでもよいかなと思っています。

ChatGPTに会話履歴が大量に残っていたり、プロジェクトをそれなりに作りこんでいたりする都合上、本格的な移行に踏み切れず惰性で使い続けている面が大きいです。

DeepSeek-R1、Stable Diffusion

ローカル動作させていたシリーズです。Stable Diffusionに関しては2025年より前からですね。ローカルでGPUを占有させると画像生成処理は早く(当時)、資料に挿入する画像などを作成するのに重宝していました。DeepSeek-R1も、手元で主に要約やQAなどで実用していました。

ChatGPTが画像生成対応したり、DeepResearchに対応したりしてからは、ローカル環境はあまり使わなくなりました。API利用料金があまりに安すぎますよね。

AWS

Bedrock

Claude Codeのモデルや商用システムのLLMとして、BedrockのClaudeやNovaを利用していました。APIキーの管理が楽になって便利ですね。

S3 Vectors

商用システムで利用しています。神サービスですね。コストが下がるのはもちろんですが、スケールも自動かつほぼ無限だし、運用設計も楽になるしで、いいことづくめですね。

距離計算のバリエーションや、ベクトル型のバリエーション(バイナリ等)がもっと増えると嬉しいです。

導入したがやめたもの

Marp for VS Code

マークダウンファイルからプレゼンスライドを作成してくれます。既存の文書を再利用しやすかったり、デザインとコンテンツを分離してコンテンツ作成に集中できたりというメリットがあります。

自分のプレゼン作成スタイルと合わなかったのでやめました。核となる図を作りこむ時間が大半なのでそこが短縮できないとあまり意味がないのと、デザインと文章を行ったり来たりしてイメージを膨らませながら作ることが自分には重要でした。

Kiro / spec-kit

一括りにしてしまいましたが、いわゆる仕様書駆動開発にカテゴライズされるようなツールです。私が使いこなせていなかったのもありますが、生成物のカロリーが高くレビュー地獄に陥ってしまったのでやめました。

おわりに

2025年は、良くも悪くもコーディングAIに振り回された1年でした。2026年もこの波は続くかもしれませんが、なるべく効率的に乗っていきたいですね。

2026年は画像処理やアウトプットにもう少し比重を置きたいと思います。

Discussion