Closed5ヶ月前にクローズ2

マルチリンガルなEmbeddingモデル Voyage AI "voyage-multilingual-2"・upstage "solar-embedding-1-large"を評価してみる。

embedding

RAG

ranx

voyageai

upstage

kun432

ranx＋LlamaIndexでretrieverを作成してranxで評価した
データセットは以下を使用

評価スクリプト

結果

#    Model                                   Hit Rate@3    MRR@3
---  --------------------------------------  ------------  ----------
a    amazon-titan-embeddings-g1              0.745         0.645
b    baai-bge-m3                             0.853ᵃʰ       0.782ᵃᵍʰ
c    cohere-embed-multilingual-v3.0          0.856ᵃᵍʰ      0.779ᵃʰ
d    infloat-multilingual-e5-large-instruct  0.866ᵃᵍʰ      0.783ᵃʰ
e    infloat-multilingual-e5-large           0.866ᵃᵍʰ      0.801ᵃᶜᵍʰ
f    openai-text-embedding-3-large           0.870ᵃᵍʰ      0.798ᵃᵍʰ
g    openai-text-embedding-3-small           0.825ᵃʰ       0.750ᵃʰ
h    openai-text-embedding-ada-002           0.792ᵃ        0.712ᵃ
i    solar-embedding-1-large                 0.869ᵃᵍʰ      0.809ᵃᵇᶜᵍʰ
j    voyage-multilingual-2                   0.888ᵃᵇᶜᵍʰ    0.813ᵃᵇᶜᵍʰ

===== @5 =====

#    Model                                   Hit Rate@5    MRR@5
---  --------------------------------------  ------------  ----------
a    amazon-titan-embeddings-g1              0.799         0.658
b    baai-bge-m3                             0.882ᵃʰ       0.789ᵃᵍʰ
c    cohere-embed-multilingual-v3.0          0.897ᵃᵍʰ      0.788ᵃʰ
d    infloat-multilingual-e5-large-instruct  0.903ᵃᵍʰ      0.792ᵃᵍʰ
e    infloat-multilingual-e5-large           0.902ᵃᵍʰ      0.810ᵃᶜᵍʰ
f    openai-text-embedding-3-large           0.906ᵃᵍʰ      0.806ᵃᵍʰ
g    openai-text-embedding-3-small           0.866ᵃ        0.759ᵃʰ
h    openai-text-embedding-ada-002           0.849ᵃ        0.726ᵃ
i    solar-embedding-1-large                 0.903ᵃᵍʰ      0.817ᵃᵇᶜᵍʰ
j    voyage-multilingual-2                   0.918ᵃᵇᵍʰ     0.820ᵃᵇᶜᵍʰ

===== @10 =====

#    Model                                   Hit Rate@10    MRR@10
---  --------------------------------------  -------------  -----------
a    amazon-titan-embeddings-g1              0.860          0.666
b    baai-bge-m3                             0.914ᵃʰ        0.793ᵃᵍʰ
c    cohere-embed-multilingual-v3.0          0.924ᵃᵍʰ       0.792ᵃʰ
d    infloat-multilingual-e5-large-instruct  0.935ᵃᵍʰ       0.796ᵃᵍʰ
e    infloat-multilingual-e5-large           0.938ᵃᵇᵍʰ      0.815ᵃᵇᶜᵍʰ
f    openai-text-embedding-3-large           0.935ᵃᵍʰ       0.810ᵃᵍʰ
g    openai-text-embedding-3-small           0.900ᵃ         0.764ᵃʰ
h    openai-text-embedding-ada-002           0.881          0.730ᵃ
i    solar-embedding-1-large                 0.923ᵃᵍʰ       0.820ᵃᵇᶜᵍʰ
j    voyage-multilingual-2                   0.953ᵃᵇᶜᵍʰᶦ    0.824ᵃᵇᶜᵈᵍʰ

Xのポスト通り悪くない結果。特にVoyage AIのほうがかなり良いが、両方ともMRRが高いのでベクトル検索のランキングの質が良いということだと思う。

このスクラップは5ヶ月前にクローズされました