Qu’est-ce que la recherche vectorielle ?
La recherche vectorielle est une fonctionnalité disponible dans la Recherche IA utilisée pour indexer, stocker et récupérer l’incorporation de vecteurs depuis un index de recherche. Vous pouvez l’utiliser pour alimenter les applications qui implémentent l’architecture de récupération augmentée (RAG), la similarité et les recherches multimodèles ou les moteurs de recommandation.
Vous trouverez ci-dessous une illustration des flux de travail d’indexation et de requête pour la recherche vectorielle.
Une requête vectorielle peut être utilisée pour faire correspondre des critères entre différents types de données sources en fournissant une représentation mathématique du contenu généré par des modèles Machine Learning. Cela élimine les limitations des recherches textuelles qui retournent des résultats pertinents à l’aide de l’intention de la requête.
Quand utiliser la recherche vectorielle
Voici quelques scénarios dans lesquels vous devriez utiliser la recherche vectorielle :
- Utilisez OpenAI ou des modèles open source pour encoder du texte et utilisez des requêtes encodées en tant que vecteurs pour récupérer des documents.
- Effectuez une recherche de similarité entre les images encodées, le texte, la vidéo et l’audio, ou un mélange de ces éléments (multimodes).
- Représentez des documents dans différentes langues à l’aide d’un modèle incorporé multilingue pour rechercher des documents dans n’importe quelle langue.
- Créez des recherches hybrides à partir de champs vectoriels et de champs textuels interrogeables, car les recherches vectorielles sont mises en œuvre au niveau du champ. Les résultats seront fusionnés pour renvoyer une seule réponse.
- Appliquez des filtres aux champs textuels et numériques, et incluez-les dans votre requête pour réduire les données que votre recherche vectorielle doit traiter.
- Créer une base de données vectorielle pour fournir une base de connaissances externe ou à utiliser comme mémoire à long terme.
Limites
Il existe quelques limitations lors de l’utilisation de la recherche vectorielle, que vous devriez noter :
- Vous devrez fournir les incorporations à l’aide d’Azure OpenAI ou d’une solution de code source ouvert similaire, car Recherche Azure AI ne les génère pas pour votre contenu.
- Les clés gérées par le client (CMK) ne sont pas prises en charge.
- Il existe des limites de stockage applicables. Vous devez donc vérifier ce que votre quota de service fournit.
Remarque
Si vos documents sont volumineux, envisagez de segmenter. Pour plus d’informations, consultez la documentation Segmenter les documents volumineux pour les solutions de recherche vectorielle dans la recherche IA.