🤗

Florence-2を使ってみる - 画像認識AI

マッサン (Masanori Yoshida)

2024/08/21に公開

Hugging Face

florence2

tech

Microsoftが提供しているオープンソースの画像認識AI「Florence-2」が話題になっていますね。キャプショニング、オブジェクト検出、グラウンディング、セグメンテーションなどのタスクにおいて優れたゼロショットおよびファインチューニングの能力があるとのことです。ゼロショットということで訓練データ無しで一定の精度がでるというのと、ファインチューニングの能力があるということで訓練することもできるようですね。

試しに使える環境として「Hugging Face」があります。

ためにし画像を読み込ませたところ、こんなかんじで画像認識してくれましたね。

オープンソースでローカル端末でも動かせるとのことで、今後さらに精度があがってくるとローカル端末上で画像認識、さらにはOCRが可能になってくると思います。ローカル端末上でOCRができると業務効率化に繋がると考えられます。

この辺のトピックは引き続き注目していきたいと考えています！

Accenture Japan (有志)

アクセンチュア株式会社に所属する社員有志による運営です。アクセンチュアの社員による様々な発信をまとめています。なお、投稿内容は社員個人の見解であり、所属する組織を代表するものではありません。

Discussion