Поделиться через


Импорт из источников данных

База знаний состоит из пар вопросов и ответов, внесенных общедоступными URL-адресами и файлами.

Примечание.

Поддержка службы QnA Maker будет прекращена 31 марта 2025 г. Новая версия вопроса и возможности ответа теперь доступна как часть языка искусственного интеллекта Azure. Сведения о возможностях ответов на вопросы в службе Языка см. в статье с ответами на вопросы. С 1 октября 2022 г. вы не сможете создавать ресурсы QnA Maker. Сведения о переносе существующих баз знаний QnA Maker в функцию вопросов и ответов см. в руководстве по миграции.

Расположение источника данных

Содержимое переносится в базу знаний из источника данных. Расположения источников данных — это общедоступные URL-адреса или файлы, которым не требуется проверка подлинности.

Файлы SharePoint, защищенные процедурой проверки подлинности, являются исключением. Ресурсы SharePoint должны быть файлами, а не веб-страницами.

QnA Maker поддерживает общедоступные URL-адреса, заканчивающиеся веб-расширением .ASPX, которые не защищены процедурой проверки подлинности.

Содержимое беседы

Набор содержимого беседы предлагается в качестве полного источника данных содержимого для нескольких языков и разговорных стилей. Это может стать основой личности бота и сэкономить время и затраты на ее написание с нуля. Узнайте, как добавить содержимое беседы в вашу базу знаний.

Загрузка данных в структурированном формате через импорт

При импорте базы знаний содержимое существующей базы знаний полностью заменяется. Для ее импорта требуется наличие структурированного файла .tsv, содержащего вопросы и ответы. Эти сведения помогают QnA Maker сгруппировать пары "вопрос — ответ" и сопоставить их с конкретным источником данных.

Вопрос Ответ Исходный код Метаданные (1 ключ: 1 значение)
Question1 Answer1 Url1 Key1:Value1 | Key2:Value2
Question2 Answer2 Редакция Key:Value

Структурированный многооборотный формат за счет импорта

Вы можете создавать многооборотные беседы в формате файла .tsv. Этот формат предоставляет вам возможность создавать многоэтапные беседы, анализируя предыдущие журналы беседы (с другими процессами, не используя QnA Maker), а затем автоматически создавать файл .tsv. Импортируйте файл, чтобы заменить имеющуюся базу знаний.

Концептуальная модель из 3-х уровней многоэтапного вопроса

Подсказки — столбец для многоэтапного файла .tsv, характерный для него. Например, .tsv, продемонстрированный в Microsoft Excel, предоставляет сведения, которые необходимо включить для определения многоэтапных дочерних элементов:

[
    {"displayOrder":0,"qnaId":2,"displayText":"Level 2 Question A"},
    {"displayOrder":0,"qnaId":3,"displayText":"Level 2 - Question B"}
]

ЗначениеdisplayOrder является числовым, а displayText — текстовым, которое не должно включать в себя разметку Markdown.

Пример многоэтапного вопроса, как показано в Microsoft Excel

Экспорт в качестве примера

Если вы не знаете, как представить вашу пару в файле "вопрос-ответ".tsv:

  • Воспользуйтесь этим скачиваемым примером с GitHub
  • Или создайте пару на портале QnA Maker, сохраните, после чего экспортируйте базу знаний для примера того, как представить пару.

Формат неструктурированных данных

Вы также можете создать базу знаний на основе неструктурированного контента, импортированного через файл. В настоящее время данная функция доступна только при загрузке документов для документов в любом из поддерживаемых форматов файлов.

Внимание

Поддержка неструктурированного контента через отправку файлов доступна только в ответах на вопросы.

Типы контента документов, которые вы можете добавить в базу знаний

Типы контента включают множество стандартных структурированных документов, таких как PDF, DOC и TXT.

Типы данных файлов и URL-адресов

В приведенной ниже таблице представлены типы содержимого и форматы файлов, поддерживаемые QnA Maker.

Тип источника Тип содержимого Примеры
URL Вопросы и ответы
(неструктурированные, с разделами или темами на домашней странице)
Страницы поддержки
(одностраничные руководства, устранение неполадок и т. д.)
Простые вопросы и ответы,
Часто задаваемые вопросы о со ссылками
Вопросы и ответы с домашней страницей разделов
Статья службы поддержки
PDF/DOC Часто задаваемые вопросы и ответы
Руководство по продукту
Брошюры
Бумажные документы
Политика в отношении флаеров
Руководство по поддержке
Файл структурированных вопросов и ответов (QnA)
и т. д.
Немногоэтапные документы
Структурированный QnA.docx,
Пример руководства по продукту.pdf
Пример полуструктурированного файла.docx,
Пример технического документа.pdf,
Неструктурированные blog.pdf,
Неструктурированный технический документ.pdf

Многоэтапные документы:
Surface Pro (DOCX)
Преимущества Contoso (DOCX)
Преимущества Contoso (PDF)
*Microsoft Excel Файл структурированных вопросов и ответов (QnA)
(включая поддержку RTF, HTML)
Немногоэтапные файлы:
Пример часто задаваемых вопросов QnA.xls

Многоэтапные документы:
Простые структурированные часто задаваемые вопросы.xls
Часто задаваемые вопросы о ноутбуках Surface.xls
*TXT/TSV Файл структурированных вопросов и ответов (QnA) Пример беседы.tsv

В случае необходимости проверки подлинности вашего источника данных, ознакомьтесь со следующими методами их размещения в QnA Maker:

  • Скачайте файл вручную и импортируйте его в QnA Maker
  • Добавьте файл из прошедшего проверку подлинности расположения SharePoint

Содержимое URL-адреса

С помощью URL-адреса в QnA Maker можно импортировать два типа документов:

  • URL-адреса вопросов и ответов
  • URL-адреса для поддержки

В каждом типе указан ожидаемый формат.

Содержимое на основе файлов

Вы можете добавить файлы в базу знаний из общедоступных источников или из вашей локальной файловой системы на портале QnA Maker.

Рекомендации по формату содержимого

Узнайте больше о правилах форматирования различных файлов.

Следующие шаги

Узнайте, как редактировать пары "вопрос-ответ".