Partager via


Instructions relatives au format pour les documents et les URL importés

Passez en revue ces instructions de mise en forme afin d’obtenir les meilleurs résultats pour votre contenu.

Mise en forme - Éléments à prendre en compte

Après l’importation d’un fichier ou d’une URL, QnA Maker convertit et stocke votre contenu dans le format Markdown. Le processus de conversion ajoute de nouvelles lignes dans le texte, telles que \n\n. Une connaissance du format Markdown vous aide à comprendre le contenu converti et à gérer le contenu de votre base de connaissances.

Si vous ajoutez ou modifiez votre contenu directement dans votre base de connaissances, utilisez la mise en forme Markdown pour créer un contenu de texte enrichi ou modifiez le contenu du format Markdown qui est déjà dans la réponse. QnA Maker prend en charge une grande partie du format Markdown pour offrir des fonctionnalités de texte enrichi à votre contenu. Toutefois, l’application cliente, telle qu’un bot de chat, peut ne pas prendre en charge le même ensemble de formats Markdown. Il est important de tester l’affichage des réponses de l’application cliente.

Consultez la liste complète des types et exemples de contenu.

Mise en forme de base du document

QnA Maker identifie les sections, sous-sections et relations dans le fichier en fonction d’indices visuels, notamment :

  • la taille de police
  • le style de police
  • la numérotation
  • les couleurs

Notes

Actuellement, nous ne prenons pas en charge l’extraction d’images à partir de documents chargés.

Manuels de produit

Un manuel comprend habituellement des supports d’orientation qui accompagnent un produit. Il aide l’utilisateur à configurer, utiliser, gérer et dépanner le produit. Lorsque QnA Maker traite un manuel, il extrait les titres et les sous-titres sous forme de questions et le contenu qui suit sous forme de réponses. Un exemple vous est proposé ici.

Voici un exemple de manuel avec une page d’index et du contenu hiérarchique

Exemple de manuel de produit pour une base de connaissances

Notes

L’extraction est plus efficace sur les manuels qui ont une table des matières et/ou une page d’index, mais aussi une structure clairement définie avec des en-têtes hiérarchiques.

Brochures, instructions, livres blancs et autres fichiers

De nombreux autres types de documents peuvent également être traités pour générer des paires de questions-réponses, à condition qu’ils aient une structure et une disposition claires. notamment : brochures, instructions, rapports, livres blancs, articles scientifiques, stratégies, ouvrages, etc. Un exemple vous est proposé ici.

Voici un exemple de document semi-structuré, sans index :

Document semi-structuré de stockage Blob Azure

Prise en charge des documents non structurés

Réponses aux questions personnalisées prend maintenant en charge les documents non structurés. Un document dont le contenu n’est pas organisé d’une manière hiérarchique bien définie, n’a pas de structure définie ou est libre de toute mise en forme peut être considéré comme un document non structuré.

Voici ci-dessous un exemple de document PDF non structuré :

Exemple de document non structuré pour une base de connaissances

Actuellement, cette fonctionnalité est disponible uniquement via le chargement de documents et pour les formats de fichier PDF et DOC.

Important

La prise en charge des fichiers/contenus non structurés est disponible uniquement dans Réponses aux questions.

Document QnA structuré

Le format des questions-réponses structurées dans les fichiers DOC consiste à alterner les questions et les réponses ligne par ligne, une question sur une ligne suivie de sa réponse sur la ligne suivante, comme indiqué ci-dessous :

Question1

Answer1

Question2

Answer2

Voici un exemple de document Word QnA structuré :

Exemple de document QnA structuré pour une base de connaissances

Fichiers TXT, TSV et XLS structurés

Les QnA sous forme de fichiers .txt, .tsv ou .xls structurés peuvent également être chargés vers QnA Maker pour créer ou augmenter une base de connaissances. Il peuvent être en texte brut, ou peuvent avoir du contenu au format RTF ou HTML. Les paires QnA ont un champ de métadonnées facultatif qui peut être utilisé pour regrouper des paires QnA en catégories.

Question Réponse Métadonnées (1 clé : 1 valeur)
Question1 Réponse1 Key1:Value1 | Key2:Value2
Question2 Réponse2 Key:Value

Toutes les autres colonnes du fichier source sont ignorées.

Exemple de fichier Excel structuré

Voici un exemple de fichier .xls QnA structuré, avec du contenu HTML :

Exemple de feuille Excel QnA structurée pour une base de connaissances

Exemple de questions multiples avec réponse unique dans un fichier Excel

Voici un exemple de fichier .xls QnA structuré, avec plusieurs questions pour une réponse unique :

Exemple d’autres questions pour une réponse unique dans un fichier Excel

Une fois le fichier importé, la paire question-réponse figure dans la base de connaissances, comme indiqué ci-dessous :

Capture d’écran d’autres questions pour une réponse unique importées dans la base de connaissances

Format de données structurées via l’importation

L’importation d’une base de connaissances remplace le contenu de la base de connaissances existante. L’importation nécessite un fichier .tsv structuré qui contient des informations sur la source de données. Ces informations aident QnA Maker à regrouper les paires de question-réponse et à les attribuer à une source de données en particulier. Les paires QnA ont un champ de métadonnées facultatif qui peut être utilisé pour regrouper des paires QnA en catégories.

Question Réponse Source Métadonnées (1 clé : 1 valeur)
Question1 Réponse1 Url1 Key1:Value1 | Key2:Value2
Question2 Réponse2 Éditorial Key:Value

Mise en forme multitour du document

  • Utilisez des titres et sous-titres pour montrer la hiérarchie. Par exemple, vous pouvez H1 pour dénoter la QnA parente et H2 pour dénoter la QnA à considérer comme invite. Utilisez une petite taille de titre pour dénoter la hiérarchie suivante. N’utilisez pas de style, de couleur ou d’autre mécanisme pour montrer la structure de votre document. QnA Maker n’extrait pas les invites multitours.
  • Le premier caractère de l’en-tête doit être en majuscule.
  • Ne pas terminer un titre par un point d’interrogation (?).

Exemples de documents :
Surface Pro (docx)
Contoso Benefits (docx)
Contoso Benefits (pdf)

URL de FAQ

QnA Maker peut prendre en charge 3 différentes formes de pages web de questions fréquentes (FAQ), à savoir :

  • Pages de FAQ simples
  • Pages de FAQ avec des liens
  • Pages de FAQ avec une page d’accueil Rubriques

Pages de FAQ simples

Il s’agit du type le plus courant de page de FAQ, dans lequel les réponses suivent immédiatement les questions dans la même page.

Voici un exemple d’une page de FAQ simple :

Exemple de page de FAQ simple pour une base de connaissances

Dans ce type de page de FAQ, les questions sont regroupées puis associées à des réponses qui se trouvent soit dans différentes sections de la même page, soit dans différentes pages.

Voici un exemple de page de FAQ avec des liens dans des sections qui se trouvent dans la même page :

Exemple de page de FAQ avec liens de sections pour une base de connaissances

Ce type de FAQ comporte une page Rubriques sur laquelle chaque rubrique est liée à un ensemble de questions et de réponses correspondant sur une autre page. QnA Maker analyse toutes les pages associées pour extraire les questions et réponses correspondantes.

Voici un exemple de page Rubriques comportant des liens vers des sections de FAQ sur d’autres pages.

Exemple de page de FAQ avec liens ciblés pour une base de connaissances

URL de support technique

QnA Maker peut traiter des pages web de support semi-structurées, telles que des articles web décrivant comment effectuer une tâche donnée, comment diagnostiquer et résoudre un problème donné, ainsi quelles sont les meilleures pratiques pour un processus donné. L’extraction fonctionne de façon optimale sur du contenu ayant une structure claire avec des titres hiérarchiques.

Notes

L’extraction pour les articles de support est une nouvelle fonctionnalité à un stade de développement encore précoce. Il convient idéalement pour les pages simples, qui sont bien structurées et qui ne contiennent pas d’en-têtes ou pieds de page complexes.

QnA Maker prend en charge l’extraction à partir de pages web semi-structurées où une structure claire est présentée avec des titres hiérarchiques

Importer et exporter une base de connaissances

L’utilisation de fichiers TSV et XLS provenant de bases de connaissances exportées n’est possible qu’en les important à partir de la page Paramètres du portail QnA Maker. Il est impossible de les utiliser en tant que sources de données lors de la création de la base de connaissances ou à partir de la fonctionnalité + Ajouter un fichier ou + Ajouter une URL dans la page Paramètres.

Lorsque vous importez la base de connaissances via ces fichiers TSV et XLS, les paires question-réponse sont ajoutées à la source éditoriale et non aux sources à partir desquelles les questions et réponses ont été extraites dans la base de connaissances exportée.

Étapes suivantes

Consultez la liste complète des types et exemples de contenu