NLP 向量搜尋

適合的度量類型通常取決於特定應用場景與向量的表示方式,但常見的選擇是 Cosine 相似度 (COSINE)內積 (IP)

Cosine 相似度
NLP 領域中常見的詞嵌入(如 Word2Vec、FastText、GloVe、Sentence-BERT),且嵌入向量已經歸一化,則推薦使用 Cosine 相似度

內積 (IP)
處理的是未標準化的向量,且關注的是權重的影響(例如大模型的輸出),可以選擇 內積

參考 基本 ANN 搜索 | Milvus 文档

Powered by Forestry.md