Azure Cosmos DB for MongoDB 仮想コアのベクトルストア

[アーティクル]
12/03/2024
適用対象:

✅ MongoDB vCore

Azure Cosmos DB for MongoDB (仮想コア) の統合されたベクトルデータベースを使用して、AI ベースのアプリケーションと Azure Cosmos DB に格納されているデータをシームレスに接続します。この統合には、 Azure OpenAI 埋め込みを使用して構築したアプリを含めることができます。ネイティブに統合されたベクトルデータベースを使用すると、Azure Cosmos DB for MongoDB (仮想コア) に直接格納される高次元ベクトルデータを、ベクトルデータの作成元であるオリジナルデータと共に効率的に格納し、インデックス作成やクエリを実行できます。代替のベクターストアにデータを転送する必要はなく、追加コストもかかりません。

ベクターストアとは

ベクトルストアまたはベクトルデータベースは、高ディメンション空間におけるデータの数学的表現であるベクトル埋め込みを格納および管理するように設計されたデータベースです。この空間では、各ディメンションがデータの特徴に対応しており、高度なデータを表現するために数万ディメンションが使われる場合があります。この空間内のベクトルの位置は、その特性を表します。単語、フレーズ、ドキュメント全体、画像、オーディオ、その他の種類のデータはすべてベクトル化できます。

ベクターストアのしくみ

ベクターストアでは、ベクトル検索アルゴリズムを使用して、埋め込みのインデックス作成やクエリを実行します。既知のベクトル検索アルゴリズムには、階層ナビゲーション可能な小さい世界 (HNSW)、反転ファイル (IVF)、DiskANN などがあります。ベクトル検索は、プロパティフィールドの完全一致ではなく、データ特性に基づいて類似項目を検索するのに役立つ方法です。この手法は、類似したテキストの検索、関連する画像の検索、おすすめ候補の作成、異常の検出などのアプリケーションで役立ちます。これは、埋め込み API を使用して、機械学習モデルを使用して作成したデータのベクトル埋め込み (数値の一覧) のクエリを実行するために使用されます。埋め込み API の例としては、Azure OpenAI 埋め込みや Hugging Face on Azure があります。ベクトル検索は、データベクトルとクエリベクトル間の距離を測定します。クエリベクトルに最も近いデータベクトルは、意味的に最も似ていると判明したものです。

Azure Cosmos DB for MongoDB (仮想コア) の統合されたベクトルデータベースでは、埋め込みを元のデータと共に格納し、インデックス作成やクエリを実行できます。この方法により、データを別の純粋なベクトルデータベースに複製する余分なコストがかかりません。さらに、このアーキテクチャではベクトル埋め込みと元のデータが一緒に保持されるため、マルチモーダルデータの操作が簡略化され、データの整合性、スケーラビリティ、パフォーマンスを向上させることができます。

ベクトル類似性検索を実行する

Azure Cosmos DB for MongoDB (仮想コア) には堅牢なベクトル検索機能が用意されているので、複雑なデータセット間で高速の類似性検索を実行できます。 Azure Cosmos DB for MongoDB でベクトル検索を実行するには、まずベクトルインデックスを作成する必要があります。現在、Cosmos DB では 3 種類のベクトルインデックスがサポートされています。

DiskANN (推奨): 大規模なデータセットに最適であり、SSD を利用して効率的なメモリ使用を実現しながら、近似ニアレストネイバー (ANN) 検索で高い再現率を維持します。
HNSW: 精度とリソース効率のバランスを取るグラフベースの構造で、高い再現率を必要とする中規模のデータセットに適しています。
IVF: クラスタリングを使用して広範なデータセットで検索速度を最適化し、対象となるクラスター内の検索に焦点を当ててパフォーマンスを向上させます。

DiskANN インデックスは、M40 レベル以上で使用できます。 DiskANN インデックスを作成するには、次のテンプレートに従って "kind" パラメーターを "vector-diskann" に設定します。

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-diskann", 
                "dimensions": <integer_value>,
                "similarity": <string_value>,
                "maxDegree" : <integer_value>, 
                "lBuild" : <integer_value>, 
            } 
        } 
    ] 
}

フィールド	タイプ	説明
`index_name`	string	インデックスの一意の名前。
`path_to_property`	string	ベクターを含むプロパティへのパス。このパスには、最上位のプロパティまたはそのプロパティへのドット表記パスを指定できます。ベクトルは、インデックスを作成し、ベクトル検索結果で使用するために `number[]` である必要があります。 `double[]` などの別の型を使用すると、ドキュメントのインデックスが作成されなくなります。インデックスのないドキュメントは、ベクトル検索の結果では返されません。
`kind`	string	作成するベクターインデックスの種類。オプションには `vector-ivf`、`vector-hnsw`、`vector-diskann` があります。
`dimensions`	integer	ベクトルの類似性の次元の数。 DiskANN は最大 2,000 個のディメンションをサポートし、将来は 40,000 個以上のサポートが予定されています。
`similarity`	string	インデックスで使用する類似性メトリック。可能なオプションは `COS` (コサイン距離)、`L2` (ユークリッド距離)、または `IP` (内積)です。
`maxDegree`	integer	グラフ内のノードあたりのエッジの最大数。このパラメーターの範囲は 20 から 2048 です (既定値は 32)。 `maxDegree` が高いほど、高次元や高精度の要件を持つデータセットに適しています。
`lBuild`	integer	DiskANN インデックスの構築中に評価される候補ネイバーの数を設定します。このパラメーターは範囲が 10 から 500 (既定値は 50) であり、精度と計算オーバーヘッドのバランスを取ります。値が大きいほど、インデックスの品質と精度が向上しますが、ビルド時間が長くなります

DiskANN を使用してベクトル検索を実行する

ベクトル検索を実行するには、$search 集計パイプラインステージを使用し、cosmosSearch 演算子を使用してクエリを実行します。 DiskANN を使用すると、地理空間フィルターやテキストベースのフィルターなどのオプションのフィルター処理を使用して、大規模なデータセット間で高パフォーマンスの検索を実行できます。

{
  "$search": {
    "cosmosSearch": {
      "path": "<path_to_property>",
      "query": "<query_vector>",  
      "k": <num_results_to_return>,  
      "filter": {"$and": [
        { "<attribute_1>": { "$eq": <value> } },
        {"<location_attribute>": {"$geoWithin": {"$centerSphere":[[<longitude_integer_value>, <latitude_integer_value>], <radius>]}}}
      ]}
    }
  }
},

フィールド	タイプ	Description
`lSearch`	integer	検索対象の動的候補リストのサイズを指定します。既定値は `40` で、`10` から `1000` までの範囲で構成できます。値を大きくすると、再現率は向上しますが、検索速度が低下する可能性があります。
`k`	integer	返される検索結果の数を定義します。 `k` 値は `lSearch` 以下である必要があります。

新しいクラスターでの DiskANN の有効化

新しくプロビジョニングされた Azure Cosmos DB for MongoDB (仮想コア) クラスターで DiskANN ベクトルインデックスを有効にするには、次の手順に従って、Azure CLI を使用してクラスターレベルの登録を実行します。

Azure CLI にログイン

az login

クラスターの機能フラグの現在の設定を取得します。これにより、新しい機能を追加するときに既存のフラグを保持できます。

az resource show --ids "/subscriptions/<sub id>/resourceGroups/<resource group name>/providers/Microsoft.DocumentDB/mongoClusters/<resource name of your Cosmos DB for MongoDB cluster>" --api-version <cluster's api version>

既存のものを削除せずに、DiskANNIndex フラグをプレビュー機能のリストに追加します。

az resource patch --ids "/subscriptions/<sub id>/resourceGroups/<resource group name>/providers/Microsoft.DocumentDB/mongoClusters/<resource name of your Cosmos DB for MongoDB cluster>" --api-version <cluster's api version> --properties "{\"previewFeatures\": [\"GeoReplicas\", \"DiskANNIndex\"]}"

フィルター処理で DiskANN インデックスを使用する例

データベースにベクターを追加する

地理空間フィルターでベクトル検索を使用するには、ベクトル埋め込みと位置座標の両方を含むドキュメントを追加します。独自のモデル、Azure OpenAI 埋め込み、または別の API (Hugging Face on Azure など) を使って埋め込みを作成できます。

from pymongo import MongoClient

client = MongoClient("<your_connection_string>")
db = client["test"]
collection = db["testCollection"]

documents = [
    {"name": "Eugenia Lopez", "bio": "CEO of AdventureWorks", "is_open": 1, "location": [-118.9865, 34.0145], "contentVector": [0.52, 0.20, 0.23]},
    {"name": "Cameron Baker", "bio": "CFO of AdventureWorks", "is_open": 1, "location": [-0.1278, 51.5074], "contentVector": [0.55, 0.89, 0.44]},
    {"name": "Jessie Irwin", "bio": "Director of Our Planet initiative", "is_open": 0, "location": [-118.9865, 33.9855], "contentVector": [0.13, 0.92, 0.85]},
    {"name": "Rory Nguyen", "bio": "President of Our Planet initiative", "is_open": 1, "location": [-119.0000, 33.9855], "contentVector": [0.91, 0.76, 0.83]}
]

collection.insert_many(documents)

DiskANN ベクトルインデックスを作成する

次の例では、フィルター処理機能を使用して DiskANN ベクトルインデックスを設定する方法を示します。これには、類似性検索用のベクトルインデックスの作成、ベクトルプロパティと地理空間プロパティを含むドキュメントの追加、追加のフィルター処理のためのフィールドのインデックス作成が含まれます。

db.command({
    "createIndexes": "testCollection",
    "indexes": [
        {
            "name": "DiskANNVectorIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": {
                "kind": "vector-diskann",
                "dimensions": 3,
                "similarity": "COS",
                "maxDegree": 32,
                "lBuild": 64
            }
        },
        { 
            "name": "is_open",
            "key": { 
                "is_open": 1 
            }      
        },
        {
            "name": "locationIndex",
            "key": {
                "location": 1
            }
        }
    ]
})

このコマンドは、exampleCollection の contentVector フィールドに DiskANN ベクトルインデックスを作成して、類似性検索を有効にします。また、次のものも追加されます。

is_open フィールドのインデックス。企業がオープンしているかどうかに基づいて結果をフィルター処理できるようにします。
地理的な距離でフィルター処理するための location フィールドの地理空間インデックス。

ベクトル検索を実行する

特定の地理的半径内で類似したベクトルを持つドキュメントを見つけるには、類似性検索に queryVector を指定し、地理空間フィルターを含めます。

query_vector = [0.52, 0.28, 0.12]
pipeline = [
    {
        "$search": {
            "cosmosSearch": {
                "path": "contentVector",
                "vector": query_vector,
                "k": 5,
                "filter": {
                    "$and": [
                        {"is_open": {"$eq": 1}},
                        {"location": {"$geoWithin": {"$centerSphere": [[-119.7192861804, 34.4102485028], 100 / 3963.2]}}}
                    ]
                }
            }
        }
    }
]

results = list(collection.aggregate(pipeline))
for result in results:
    print(result)

この例では、ベクトル類似性検索は、指定された COS 類似性メトリックに基づいて上位 k 件の最も近いベクトルを返します。一方、結果をフィルター処理して、半径 100 マイル以内のオープンしている企業のみを含めます。

[
  {
    similarityScore: 0.9745354109084544,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'CEO of AdventureWorks',
      is_open: 1,
      location: [-118.9865, 34.0145],
      contentVector: [0.52, 0.20, 0.23]
    }
  },
  {
    similarityScore: 0.9006955671333992,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'President of Our Planet initiative',
      is_open: 1,
      location: [-119.7302, 34.4005],
      contentVector: [0.91, 0.76, 0.83]
    }
  }
]

この結果は、半径 100 マイルとオープンしている企業に制限された、queryVector に似た上位のドキュメントを示します。各結果には類似性スコアとメタデータが含まれており、Cosmos DB for MongoDB の DiskANN が、地域依存の検索エクスペリエンスを強化するためにベクトルと地理空間のクエリの組み合わせをどのようにサポートしているかを示します。

M40 クラスターレベル以上で、HNSW (階層ナビゲーション可能な小さい世界) インデックスを作成できます。 HSNW インデックスを作成するには、以下のテンプレートに従って、"kind" パラメーターを "vector-hnsw" に設定したベクトルインデックスを作成する必要があります。

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": <integer_value>, 
                "efConstruction": <integer_value>, 
                "similarity": "<string_value>", 
                "dimensions": <integer_value> 
            } 
        } 
    ] 
}

フィールド	タイプ	Description
`m`	integer	レイヤーあたりの接続の最大数 (既定では `16`、最小値は `2`、最大値は `100`)。 m が高いほど、高次元や高精度の要件を持つデータセットに適しています。
`efConstruction`	integer	グラフを構築するための動的候補リストのサイズ (既定では `64`、最小値は `4`、最大値は `1000`)。 `efConstruction` が高いほど、インデックスの品質と精度が向上しますが、インデックスの作成に必要な時間も長くなります。 `efConstruction` は少なくとも `2 * m` である必要があります

HNSW を使用してベクトル検索を実行する

ベクトル検索を実行するには、cosmosSearch 演算子を使用してクエリの $search 集計パイプラインステージを使用します。

{
    "$search": {
        "cosmosSearch": {
            "vector": <query_vector>,
            "path": "<path_to_property>",
            "k": <num_results_to_return>,
            "efSearch": <integer_value>
        },
    }
}

フィールド	タイプ	Description
`efSearch`	integer	検索対象の動的候補リストのサイズ (既定では `40`)。値を大きくすると、速度を犠牲にして再現率が向上します。

Note

大きなデータセットで HSNW インデックスを作成すると、Azure Cosmos DB for MongoDB 仮想コアリソースがメモリ不足になったり、データベースで実行されている他の操作のパフォーマンスが制限されたりする可能性があります。このような問題が発生した場合は、リソースをより高次のクラスターレベルにスケーリングするか、新しい DiskANN ベクトルインデックスを作成することで軽減できます。

HNSW インデックスの使用例

次の例では、ベクターのインデックス作成、ベクタープロパティを持つドキュメントの追加、ベクター検索の実行、インデックス構成の取得を行う方法について説明します。

use test;

db.createCollection("exampleCollection");

db.runCommand({ 
    "createIndexes": "exampleCollection",
    "indexes": [
        {
            "name": "VectorSearchIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": 16, 
                "efConstruction": 64, 
                "similarity": "COS", 
                "dimensions": 3
            } 
        } 
    ] 
});

このコマンドを使用すると、指定したコレクション exampleCollection に格納されているドキュメントの contentVector プロパティに対して HNSW インデックスが作成されます。 cosmosSearchOptions プロパティは、HNSW ベクターインデックスのパラメーターを指定します。入れ子になったプロパティに格納されているベクターがドキュメントに含まれている場合は、ドット表記パスを使用してこのプロパティを設定できます。たとえば、contentVector が text のサブプロパティである場合、text.contentVector を使用できます。

データベースにベクターを追加する

データベースのコレクションにベクトルを追加するには、最初に、独自のモデル、Azure OpenAI 埋め込み、または別の API (Hugging Face on Azure など) を使って埋め込みを作成する必要があります。この例では、サンプル埋め込みを使用して新しいドキュメントが追加されます。

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", vectorContent: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", vectorContent: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", vectorContent: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", vectorContent: [0.91, 0.76, 0.83]},
]);

ベクター検索を実行する

最後の例を続けて、別のベクター queryVector を作成します。ベクター検索では、queryVector とドキュメントの contentVector パス内のベクトル間の距離が測定されます。パラメーター k (ここでは 2 に設定されています) を設定することで、検索から返される結果の数を設定できます。また、候補ベクトルリストのサイズを制御する整数である efSearch を設定することもできます。値を大きくすると精度が向上する可能性があります。ただし、結果として検索が遅くなります。これは省略可能なパラメーターで、既定値は 40 です。

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    "$search": {
        "cosmosSearch": {
            "vector": "queryVector",
            "path": "contentVector",
            "k": 2,
            "efSearch": 40
        },
    }
  }
}
]);

この例では、Mongo シェルを介した入力として queryVector を使用して、ベクター検索が実行されます。検索結果は、クエリベクターと最も類似している 2 つの項目の一覧で、類似性スコアによって並べ替えられています。

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

反転ファイル (IVF) アルゴリズムを使用してベクトルインデックスを作成するには、次の createIndexes テンプレートを使用し、"kind" パラメーターを "vector-ivf" に設定します。

{
  "createIndexes": "<collection_name>",
  "indexes": [
    {
      "name": "<index_name>",
      "key": {
        "<path_to_property>": "cosmosSearch"
      },
      "cosmosSearchOptions": {
        "kind": "vector-ivf",
        "numLists": <integer_value>,
        "similarity": "<string_value>",
        "dimensions": <integer_value>
      }
    }
  ]
}

フィールド	タイプ	Description
`numLists`	integer	この整数は、ベクターデータをグループ化するために転置ファイル (IVF) インデックスによって使用されるクラスターの数です。ドキュメント数が 100 万までの場合は `numLists` に `documentCount/1000` を、100 万を超える場合は `sqrt(documentCount)` を設定することをお勧めします。 `numLists` の値に `1` を使用することは、パフォーマンスが制限されるブルートフォース検索を実行することと同様です。

重要

numLists パラメーターを正しく設定することは、適切な精度とパフォーマンスを実現するために重要です。 numLists は、最大 100 万個のドキュメントに対して documentCount/1000 に設定することをお勧めします。 100 万個を超えるドキュメントでは、最適な結果を得るには DiskANN ベクトルインデックスを使用することをお勧めします。

データベース内の項目の数が増えるにつれて、ベクター検索の待機時間パフォーマンスの向上を実現するために、 numList を大きくするように調整する必要があります。

新しいシナリオを試したり、小さなデモを作成したりする場合は、numLists を 1 に設定して、すべてのベクトルでブルートフォース検索を実行できます。これにより、ベクトル検索から最も正確な結果を得られますが、検索速度と待機時間が遅くなる点にご注意ください。初期設定後は、上記のガイダンスを使用して numLists パラメーターを調整する必要があります。

IVF を使用してベクトル検索を実行する

ベクター検索を実行するには、MongoDB クエリで $search 集計パイプラインステージを使用します。 cosmosSearch インデックスを使用するには、新しい cosmosSearch 演算子を使用します。

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <query_vector>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

ベクトル検索で検出されたドキュメントと共に類似度スコア (searchScore) を取得するには、$project 演算子を使用して searchScore を含め、結果でその名前を <custom_name_for_similarity_score> に変更します。これにより、ドキュメントも入れ子になったオブジェクトとして投影されます。類似度スコアは、ベクトルインデックスで定義されているメトリックを使用して計算されることに注意してください。

重要

ベクトルは、インデックスを作成するために number[] である必要があります。 double[] などの別の型を使用すると、ドキュメントのインデックスが作成されなくなります。インデックスのないドキュメントは、ベクトル検索の結果では返されません。

IVF インデックスを使用した例

転置ファイル (IVF) インデックスを作成する方法で、ベクトルをクラスターに整理できます。ベクトル検索では、最初にクエリベクトルがこれらのクラスターの中心と比較されます。その後、中心がクエリベクトルに最も近いクラスター内で検索が実行されます。

numLists パラメーターによって、作成するクラスターの数が決定されます。クラスターが 1 つということは、ブルートフォースや kNN の検索と同様、データベース内のすべてのベクトルに対して検索が実行されることを意味します。この設定により、精度が最も高くなりますが、待機時間も最も長くなります。

numLists の値を大きくすると、より多くのクラスターが作成され、それぞれに含まれるベクトルが少なくなります。たとえば、numLists=2 の場合、各クラスターに含まれるベクトル数は、numLists=3 の場合よりも多くなります。クラスターあたりのベクトル数が少ないほど、検索が高速化されます (待機時間が短く、1 秒あたりのクエリ数が多くなります)。ただし、これにより、データベース内で最もクエリベクトルに類似したベクトルが見つからない可能性が高くなります。これはクラスタリングの不完全な性質が原因で、実際の "最も近い" ベクトルが別のクラスターに存在する間に、検索が 1 つのクラスターに集中する可能性があります。

nProbes パラメーターによって、検索するクラスターの数が制御されます。既定では 1 に設定されています。つまり、中心がクエリベクトルに最も近いクラスターのみが検索されます。この値を大きくすると、検索の対象となるクラスターが増え、精度が向上しますが、より多くのクラスターとベクトルが検索されるため、待機時間も長くなります (したがって、1 秒あたりのクエリ数は減少します)。

ベクターインデックスを作成する

use test;

db.createCollection("exampleCollection");

db.runCommand({
  createIndexes: 'exampleCollection',
  indexes: [
    {
      name: 'vectorSearchIndex',
      key: {
        "vectorContent": "cosmosSearch"
      },
      cosmosSearchOptions: {
        kind: 'vector-ivf',
        numLists: 3,
        similarity: 'COS',
        dimensions: 3
      }
    }
  ]
});

このコマンドを使用すると、指定したコレクション exampleCollection に格納されているドキュメントの vectorContent プロパティに対して vector-ivf インデックスが作成されます。 cosmosSearchOptions プロパティは、IVF ベクターインデックスのパラメーターを指定します。入れ子になったプロパティに格納されているベクターがドキュメントに含まれている場合は、ドット表記パスを使用してこのプロパティを設定できます。たとえば、vectorContent が text のサブプロパティである場合、text.vectorContent を使用できます。

データベースにベクターを追加する

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", vectorContent: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", vectorContent: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", vectorContent: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", vectorContent: [0.91, 0.76, 0.83]},
]);

ベクター検索を実行する

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <vector_to_search>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

$search を使用してベクトルとベクトル距離 (類似度スコアとも呼ばれます) を照会する

最後の例を続けて、別のベクター queryVector を作成します。ベクター検索では、queryVector とドキュメントの vectorContent パス内のベクトル間の距離が測定されます。パラメーター k (ここでは 2 に設定されています) を設定することで、検索から返される結果の数を設定できます。また、各検索で検査される近くのクラスターの数を制御する整数である nProbes を設定することもできます。値を大きくすると精度が向上する可能性があります。ただし、結果として検索が遅くなります。これは省略可能なパラメーターで、既定値は 1 であり、ベクターインデックスで指定された numLists 値より大きくすることはできません。

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    $search: {
      "cosmosSearch": {
        "vector": queryVector,
        "path": "vectorContent",
        "k": 2
      },
    "returnStoredSource": true }},
  {
    "$project": { "similarityScore": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
]);

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

ベクターインデックス定義を取得する

コレクションからベクターインデックス定義を取得するには、listIndexes コマンドを使用します。

db.exampleCollection.getIndexes();

この例では、インデックスの作成に使用されたすべての cosmosSearch パラメーターと共に vectorIndex が返されます。

[
  { v: 2, key: { _id: 1 }, name: '_id_', ns: 'test.exampleCollection' },
  {
    v: 2,
    key: { vectorContent: 'cosmosSearch' },
    name: 'vectorSearchIndex',
    cosmosSearch: {
      kind: <index_type>, // options are `vector-ivf`, `vector-hnsw`, and `vector-diskann`
      numLists: 3,
      similarity: 'COS',
      dimensions: 3
    },
    ns: 'test.exampleCollection'
  }
]

フィルター選択されたベクトル検索 (プレビュー)

$lt、$lte、$eq、$neq、$gte、$gt、$in、$nin、$regex など、サポートされているクエリフィルターを使用して、ベクトル検索を実行できるようになりました。 Azure サブスクリプションの [プレビュー機能] タブで、[ベクトル検索のフィルター選択] 機能を有効にします。プレビュー機能の詳細については、こちらを参照してください。

まず、ベクトルのインデックスとフィルターのインデックスを定義する必要があります。たとえば、プロパティでフィルターインデックスを定義できます

db.runCommand({ 
     "createIndexes": "<collection_name",
    "indexes": [ {
        "key": { 
            "<property_to_filter>": 1 
               }, 
        "name": "<name_of_filter_index>" 
    }
    ] 
});

次に、以下に示すように "filter" の用語をベクトル検索に追加します。この例では、フィルターは、"title" プロパティが ["not in this text", "or this text"] の一覧にないドキュメントを検索しています。


db.exampleCollection.aggregate([
  {
      '$search': {
          "cosmosSearch": {
              "vector": "<query_vector>",
              "path": <path_to_vector>,
              "k": num_results,
              "filter": {<property_to_filter>: {"$nin": ["not in this text", "or this text"]}}
          },
          "returnStoredSource": True }},
      {'$project': { 'similarityScore': { '$meta': 'searchScore' }, 'document' : '$$ROOT' }
}
]);

重要

プレビュー段階では、フィルター選択されたベクトル検索では、精度を高めるためにベクトルインデックスパラメーターを調整する必要がある場合があります。たとえば、HNSW を使用する場合は m、efConstruction、efSearch を増やし、IVF を使用する場合は numLists または nProbes を増やすことで、より良い結果が得られる可能性があります。使用前に構成をテストし、満足のいく結果が得られることを確認する必要があります。

LLM オーケストレーションツールを使用する

セマンティックカーネルでベクトルデータベースとして使用する

セマンティックカーネルを使用して、Azure Cosmos DB for MongoDB 仮想コアと LLM からの情報取得を調整できます。こちらをご覧ください。

https://github.com/microsoft/semantic-kernel/tree/main/python/semantic_kernel/connectors/memory/azure_cosmosdb

LangChain でベクトルデータベースとして使用する

LangChain を使用して、Azure Cosmos DB for MongoDB 仮想コアと LLM からの情報取得を調整できます。こちらをご覧ください。

LangChain でセマンティックキャッシュとして使用する

LangChain と Azure Cosmos DB for MongoDB (仮想コア) を使用して、セマンティックキャッシュをオーケストレーションします。これには、LLM API のコストを削減し、応答の待機時間を低減できる、前に記録した LLM 応答を使用します。詳細はこちら

機能および制限事項

サポートされている距離メトリック: L2 (ユークリッド)、内積、コサイン。
サポートされているインデックス作成方法: IVFFLAT、HNSW、DiskANN (プレビュー)
最大 2,000 次元のサイズのインデックス作成ベクター。
インデックス作成は、パスごとに 1 つのベクトルにのみ適用されます。
ベクトルパスごとに作成できるインデックスは 1 つだけです。

まとめ

このガイドでは、ベクターインデックスの作成、ベクターデータを含むドキュメントの追加、類似性検索の実行、インデックス定義の取得を行う方法について説明しました。統合されたベクトルデータベースを使用すると、高次元ベクターデータを Azure Cosmos DB for MongoDB 仮想コアに直接、効率的に格納、インデックス付けし、クエリを実行できます。この機能を使うと、ベクトル埋め込みを使ってデータの可能性を最大限に引き出し、より正確、効率的で強力なアプリケーションを構築できます。

次のステップ

Azure Cosmos DB for MongoDB のライフタイムフリーレベル仮想コアクラスターを作成する

次の方法で共有

Azure Cosmos DB for MongoDB 仮想コアのベクトルストア

ベクターストアとは

ベクターストアのしくみ

ベクトル類似性検索を実行する

DiskANN を使用してベクトル検索を実行する

新しいクラスターでの DiskANN の有効化

フィルター処理で DiskANN インデックスを使用する例

データベースにベクターを追加する

DiskANN ベクトルインデックスを作成する

ベクトル検索を実行する

HNSW を使用してベクトル検索を実行する

HNSW インデックスの使用例

データベースにベクターを追加する

ベクター検索を実行する

IVF を使用してベクトル検索を実行する

IVF インデックスを使用した例

ベクターインデックスを作成する

データベースにベクターを追加する

ベクター検索を実行する

$search を使用してベクトルとベクトル距離 (類似度スコアとも呼ばれます) を照会する

ベクターインデックス定義を取得する

フィルター選択されたベクトル検索 (プレビュー)

LLM オーケストレーションツールを使用する

セマンティックカーネルでベクトルデータベースとして使用する

LangChain でベクトルデータベースとして使用する

LangChain でセマンティックキャッシュとして使用する

機能および制限事項

まとめ

次のステップ

フィードバック

その他のリソース

次の方法で共有

Azure Cosmos DB for MongoDB 仮想コアのベクトル ストア

ベクター ストアとは

ベクター ストアのしくみ

ベクトル類似性検索を実行する

DiskANN を使用してベクトル検索を実行する

新しいクラスターでの DiskANN の有効化

フィルター処理で DiskANN インデックスを使用する例

データベースにベクターを追加する

DiskANN ベクトル インデックスを作成する

ベクトル検索を実行する

ベクター インデックス定義を取得する

フィルター選択されたベクトル検索 (プレビュー)

LLM オーケストレーション ツールを使用する

セマンティック カーネルでベクトル データベースとして使用する

LangChain でベクトル データベースとして使用する

LangChain でセマンティック キャッシュとして使用する

機能および制限事項

まとめ

関連するコンテンツ

次のステップ

フィードバック

その他のリソース

Azure Cosmos DB for MongoDB 仮想コアのベクトルストア

ベクターストアとは

ベクターストアのしくみ

DiskANN ベクトルインデックスを作成する

ベクターインデックス定義を取得する

LLM オーケストレーションツールを使用する

セマンティックカーネルでベクトルデータベースとして使用する

LangChain でベクトルデータベースとして使用する

LangChain でセマンティックキャッシュとして使用する