Attacher un domaine ou un domaine composite à des données de référence – Data Quality Services (DQS)
S'applique à : SQL Server
Cette rubrique explique comment attacher des domaines/domaines composites dans une base de connaissances à un service de données de référence dans Place de marché Azure pour générer des connaissances sur les données de référence de haute qualité. Chaque service de données de référence contient un schéma (colonnes de données). Après avoir attaché un domaine ou un domaine composite à un service de données de référence, vous devez mapper le domaine joint, ou chaque domaine au sein du domaine composite joint, aux colonnes appropriées du schéma de service des données de référence. L'attachement d'un domaine composite à un service de données de référence vous permet d'attacher un seul domaine à un service de données de référence, puis de mapper les différents domaines du domaine composite aux colonnes appropriées du schéma de service des données de référence.
Important
Cet article mentionne des services de données de référence tiers qui étaient disponibles dans Azure DataMarket. DataMarket et Data Services, notamment les données d’adresse Melissa par exemple, ont été supprimés après le 31/12/2016. Par conséquent, vous ne pouvez plus exécuter les exemples de cet article avec les services spécifiés de DataMarket. Vous pouvez quand même utiliser les services de données de référence directement disponibles en ligne des fournisseurs de données de référence tiers.
Avertissement
Le domaine composite associé à un service de données de référence est disponible dans la liste déroulante des domaines lors du mappage des domaines aux colonnes du schéma de service de données de référence. Ne mappez pas le domaine composite à une colonne dans le schéma de service de données de référence ; vous devez uniquement mapper les domaines individuels au sein d'un domaine composite aux colonnes appropriées dans le schéma de service de données de référence. Sinon, cela génère une erreur.
Un schéma de service de données de référence peut avoir une colonne obligatoire qui doit être mappée au domaine approprié si vous choisissez d'utiliser le schéma. La colonne obligatoire d’un schéma de données de référence est identifiée par « (M) » au niveau de son nom. Par exemple, Adresse est la colonne de schéma obligatoire dans Melissa Data - Address Data et CompanyName est la colonne de schéma obligatoire dans Digital Trowel Inc. - Us companies and professional data for SQL users.
Dans cette rubrique, nous allons créer quatre domaines : Address Line, City, Stateet Zip, sous un domaine composite Address Verification. Joignez le domaine composite au service de données de référence Melissa Data - Address Check, puis mappez les domaines dans le domaine composite aux colonnes appropriées dans le schéma de service de données de référence.
Avant de commencer
Prérequis
Vous devez avoir configuré Data Quality Services (DQS) pour utiliser les services de données de référence. Consultez Configurer DQS pour utiliser des données de référence.
Sécurité
autorisations
Vous devez disposer du rôle de dqs_kb_editor sur la base de données de DQS_MAIN pour mapper les domaines aux données de référence.
Mapper les domaines aux données de référence de Melissa Data
Démarre le Data Quality Client. Pour plus d'informations, consultez Exécuter l'application Data Quality Client.
Dans l'écran d'accueil Data Quality Client, sous Gestion des bases de connaissances, cliquez sur Nouvelle base de connaissances.
Dans l'écran Nouvelle Base de connaissances , tapez un nom pour la nouvelle base de connaissances, cliquez sur l'activité Gestion de l'arborescence du domaine , puis cliquez Créer.
Dans l'écran Gestion de l'arborescence du domaine , cliquez sur l'icône Créer un domaine pour créer un domaine. Créez les quatre domaines suivants : Adresse, Ville, Étatet Code postal.
Cliquez sur l'icône Créer un domaine composite pour créer un domaine composite. Dans la boîte de dialogue Créer un domaine composite , tapez Contrôle d'adresse dans la zone Nom du domaine composite et incluez tous les domaines créés à l'étape 3 du domaine composite. Cliquez sur OK.
Dans le volet Domaine à gauche, sélectionnez le domaine composite en cliquant sur Contrôle d'adresse, puis cliquez sur l'onglet Données de référence à droite.
Cliquez sur l'icône Parcourir .
Dans la boîte de dialogue Catalogue des fournisseurs de données de référence en ligne :
Sous DataMarket Data Quality Services, sélectionnez la zone Melissa Data - Contrôle d’adresse.
Mappez les colonnes du service de données de référence Melissa Data - Address Check aux domaines appropriés (Address Line, City, State et Zip). Vous mappez les colonnes en sélectionnant une colonne de service de données de référence dans la colonne Schéma de service de données de référence , puis en sélectionnant le domaine approprié dans la colonne Domaine . Pour ajouter des lignes à la table, cliquez sur l'icône Ajouter une entrée de schéma .
Cliquez sur OK pour enregistrer les modifications et fermez la boîte de dialogue Catalogue des fournisseurs de données de référence en ligne .
Remarque
- Dans la boîte de dialogue Catalogue des fournisseurs de données de référence en ligne, le nœud DataMarket Data Quality Services affiche tous les fournisseurs de services de données de référence auxquels vous vous êtes abonné dans la Place de marché Azure. Si vous avez configuré des fournisseurs tiers directs en ligne de services de données de référence dans DQS, ils apparaîtront sous un autre nœud appelé Fournisseurs tiers directs en ligne (non disponible à présent car aucun tiers fournisseur tiers direct en ligne n'est configuré dans DQS).
Vous retournerez à l'onglet Données de référence. Dans la zone Paramètres des fournisseurs, modifiez les valeurs dans les zones suivantes, si nécessaire :
Seuil de correction automatique: les corrections des services de données de référence avec un niveau de confiance supérieur à ces valeurs de seuil seront automatiquement effectuées. Entrez une valeur en notation décimale de la valeur de pourcentage correspondante. Par exemple, entrez 0,9 pour 90 %.
Candidats suggérés: nombre des candidats suggérés à afficher à partir du service de données de référence.
Confiance minimale: les suggestions du service des données de référence avec un niveau de confiance inférieur à cette valeur sont ignorées. Entrez une valeur en notation décimale de la valeur de pourcentage correspondante. Par exemple, entrez 0,6 pour 60 %.
Cliquez sur Terminer pour publier la base de connaissances. Un message de confirmation s'affiche après que la base de connaissances a été publiée avec succès.
Vous pouvez maintenant utiliser cette base de connaissances pour l'activité de nettoyage dans un projet de qualité des données afin de normaliser et nettoyer les adresses américaines de vos données sources selon les connaissances fournies par Melissa Data via Place de marché Azure.
Suivi : Après le mappage d'un domaine aux données de référence
Créez un projet de qualité des données et exécutez l'activité de nettoyage sur vos données sources contenant les adresses américaines en les comparant à la base de connaissances créée dans cette rubrique. Consultez Nettoyer les données à l'aide de la connaissance des données de référence (externes).
Voir aussi
Services de données de référence dans DQS
Nettoyage des données