Azure Cosmos DB 中的向量搜尋
向量搜尋是一種方法,可協助您根據其資料特性來尋找類似的項目,而不是根據屬性欄位上完全相符的項目。 此技術適用於搜尋類似文字、尋找相關影像、提出建議,甚至偵測異常這類應用程式。 其運作方式是取得資料與查詢的向量內嵌,然後測量資料向量與查詢向量之間的距離。 最接近查詢向量的資料向量就是所找到語意最類似的資料向量。
範例
這個互動式視覺效果顯示向量之間相近度和距離的一些範例。
演算法
兩種主要的向量搜尋演算法類型為 K 近鄰 (kNN) 和近似近鄰 (ANN)。 在 kNN 與 ANN 之間,後者在精確度與效率之間提供平衡,使其更適合大規模應用程式。 一些已知的 ANN 演算法包括倒置檔案 (IVF)、階層式導覽小型世界 (HNSW),以及最先進的 DiskANN。
在功能完整的資料庫中使用整合式向量搜尋功能(與純向量資料庫相反) 提供有效率的方式,直接與其他應用程式資料一起儲存、編製索引及搜尋高維度向量資料。 此方法可讓您無須將資料移轉至成本較高的替代向量資料庫,並且能順暢地整合您的 AI 驅動應用程式。