😀
PaliGemma 2(パリジェマ・ツー)とは?
PaliGemma2(パリジェマ・ツー)とは画像認識ができるオープンソースAI
PaliGemma2は、第2世代で画像認識もできます。
商用利用は可でもちろん無料で使えます。
PaliGemma2(パリジェマ・ツー)ができること
・画像キャプション生成:写真を見て一言で説明
・画像に関する質問応答(VQA):「この画像の中の動物は何匹?」に答える
・物体認識&分類:画像内の物体を特定して分類
・画像理解型プロンプト処理:「この図を説明して」などに応答可能
・OCRの補助:画像内のテキストに関する理解もある程度OK
PaliGemma2(パリジェマツー)のできること例
画像:海辺で犬が走っている写真
「この写真には何が写っていますか?」
→ 出力: "A dog is running on the beach near the ocean."
なお、パリジェマツーは日本語に対応済みです。
こんな生成AIアプリにもおすすめ
・カメラアプリの画像説明:写真を撮ると自動でキャプション
・視覚障がい者支援:周囲の様子をテキストで説明
・レシート読み取り&仕分け:OCR + 意味理解で分類支援
・美術解説アプリ:絵画や写真の自動解説
Discussion