Сопоставление качества данных в надстройке MDS для Excel
Область применения: SQL Server — Только Управляемый экземпляр SQL Azure Windows
Со временем в репозиторий MDS потребуется добавить дополнительные данные. Перед добавлением может быть полезно сравнить новые данные с данными, которые уже управляются в MDS, чтобы избежать дублирования или добавления неточных данных.
Надстройка MDS для Excel использует функцию служб качества данных (DQS) SQL Server для сопоставления данных, аналогичных данным. При использовании функции сопоставления в надстройке одинаковые записи группируются вместе и выводится показатель, отражающий точность результата. Дополнительные сведения о возможностях сопоставления в службах DQS см. в разделе Data Matching.
Рабочий процесс для сопоставления качества данных
При использовании DQS с надстройкой MDS для Excel используйте следующий рабочий процесс:
Получите список данных, управляемых MDS, и объедините его со списком данных, которые не управляются в MDS. Дополнительные сведения см. в разделе "Объединение данных" (надстройка MDS для Excel).
Используйте базу набора знаний служб DQS для сравнения данных в объединенном списке. Дополнительные сведения см. в разделе "Сопоставление аналогичных данных" (надстройка MDS для Excel).
Чтобы просмотреть дополнительные сведения о схожести, обнаруженной службами DQS, отобразите столбцы со сведениями.
Просмотрите результаты и определите, какие данные следует добавить в репозиторий MDS и какие данные дублируются.
Опубликуйте новые и/или обновленные данных в репозитории MDS.
Базы знаний
Результаты сопоставления, предлагаемые в надстройке, основаны на базе знаний служб DQS.
База знаний по умолчанию (DQS Data) создается при установке служб DQS. Если выбрать для использования базу знаний по умолчанию (без добавления политики сопоставления по умолчанию в базу знаний клиента DQS Data Quality), необходимо сопоставить столбцы в листе с доменами в базе знаний, затем присвоить значение веса с выбранными доменами.
Для создания новой базы знаний с политикой маршрутов можно использовать клиент DQS, а можно добавить политику сопоставления в базе знаний по умолчанию. В этом случае значения веса определяются уже созданной политикой сопоставления и потребуется только сопоставить столбцы и домены. Дополнительные сведения см. в статье Create a Matching Policy.
Дополнительные сведения о базах знаний см. в разделе DQS Knowledge Bases and Domains.
Связанные задачи
Описание задачи | Раздел |
---|---|
Объедините внешние данные с данными, управляемыми MDS, и подготовьтесь к их сравнению. | Объединение данных (надстройка MDS для Excel) |
Воспользуйтесь базой набора знаний служб DQS для определения схожести данных. | Сопоставление аналогичных данных (надстройка MDS для Excel) |