🤗

Florence-2を使ってみる - 画像認識AI

2024/08/21に公開

Microsoftが提供しているオープンソースの画像認識AI「Florence-2」が話題になっていますね。キャプショニング、オブジェクト検出、グラウンディング、セグメンテーションなどのタスクにおいて優れたゼロショットおよびファインチューニングの能力があるとのことです。ゼロショットということで訓練データ無しで一定の精度がでるというのと、ファインチューニングの能力があるということで訓練することもできるようですね。

試しに使える環境として「Hugging Face」があります。
https://huggingface.co/spaces/gokaygokay/Florence-2

ためにし画像を読み込ませたところ、こんなかんじで画像認識してくれましたね。

オープンソースでローカル端末でも動かせるとのことで、今後さらに精度があがってくるとローカル端末上で画像認識、さらにはOCRが可能になってくると思います。ローカル端末上でOCRができると業務効率化に繋がると考えられます。

この辺のトピックは引き続き注目していきたいと考えています!

Accenture Japan (有志)

Discussion