Zenn
マルチモーダル
このトピックを指定するには
マルチモーダル
と入力
Articles
55
Scraps
21
scraps
Trending
Alltime
Latest
llama.cppのマルチモーダルを試す
Closed
kun432
4ヶ月前にクローズ
#
VLM
#
multimodal
#
LLM
#
llama.cpp
9
「Heron-NVILA-Lite」を試す
Closed
kun432
4ヶ月前にクローズ
#
VLM
#
turing
#
multimodal
#
Heron-NVILA-Lite
6
音声の局所的編集について
Open
Ackkerman
4ヶ月前にコメント追加
#
LLM
#
音声合成
#
音声認識
#
マルチモーダル
28
「Ovis2」を試す
Closed
kun432
2025/02/26にクローズ
#
VLM
#
LLM
#
multimodal
#
Ovis
7
マルチモーダルなコンテンツからポッドキャスト風音声を生成する「Podcastfy」を試す
Closed
kun432
2024/10/20にクローズ
#
multimodal
#
LLM
#
PDF
#
Audio
8
Ovis1.6-Gemma2-9Bを試す
Closed
kun432
2024/10/11にクローズ
#
Ovis
#
multimodal
#
LLM
6
Molmoを試す
Closed
kun432
2024/10/10にクローズ
#
multimodal
#
LLM
#
Molmo
8
【論文】Llama-Omniを読む
Open
ノーコール森本🤙AI電話SaaS…
2024/09/28にコメント追加
#
multimodal
#
speechtospeech
#
Llama
#
機械学習
35
LlamaIndexのマルチモーダルを試す
Open
kun432
2024/07/11にコメント追加
#
multimodal
#
LLM
#
LlamaIndex
7
Vertex AI で Gemini 1.5を使う 1: テキスト生成・チャット・マルチモーダル
Closed
kun432
2024/07/07にクローズ
#
multimodal
#
Google
#
LLM
#
Vertex AI
#
Gemini
14
「Phi-4-multimodal-instruct」を試す
Closed
kun432
2025/03/01にクローズ
#
multimodal
#
VLM
#
LLM
#
phi4
5
マルチモーダルEmbeddingモデル「E5-V」を試す
Closed
kun432
2024/07/28にクローズ
#
multimodal
#
e5v
#
embeddings
5
ColPali: PaliGemma-3BとColBERTストラテジーに基づくビジュアルレトリバー
Closed
kun432
2024/12/01にクローズ
#
retrieval
#
LLM
#
RAG
#
multimodal
5
マルチリンガル/マルチモーダルなEmbeddingモデル「Visualized BGE」を試す
Closed
kun432
2024/07/12にクローズ
#
multimodal
#
baai
#
embeddings
#
bge
3
LLaVA-1.5を試す
Closed
kun432
2023/10/09にクローズ
#
multimodal
#
gpt4v
#
LLaVA
#
LLM
7
【Speech to Speech】moshiの論文を読む
Open
ノーコール森本🤙AI電話SaaS…
6ヶ月前にコメント追加
#
fullduplex
#
multimodal
#
LLM
#
speechtospeech
7
MiniGPT-v2を試す
Closed
kun432
2023/10/17にクローズ
#
LLM
#
multimodal
#
MiniGPT-v2
#
minigpt
4
Qwen-VLを試す
Closed
kun432
2023/10/09にクローズ
#
multimodal
#
gpt4v
#
Qwen-VL
#
LLM
7
「VARAG」を試す
Open
kun432
2024/10/11にコメント追加
#
multimodal
#
LLM
#
varag
#
RAG
1
Qwen2-VLを試す
Closed
kun432
2024/10/10にクローズ
#
Qwen
#
Qwen2
#
Qwen2-VL
#
multimodal
#
LLM
2
Multilingual CLIPのデモを修正
Closed
Lunran
2022/10/24にクローズ
#
multimodal
#
clip
3