Éditeur de transformation de regroupement probable (onglet Avancé).
Utilisez l'onglet Avancé de la boîte de dialogue Éditeur de transformation de regroupement probable pour spécifier les colonnes d'entrée et de sortie, définir des seuils de similarité et des séparateurs.
Notes
Les Exhaustive
propriétés et MaxMemoryUsage
de la transformation de regroupement flou ne sont pas disponibles dans l’éditeur de transformation de regroupement flou, mais peuvent être définies à l’aide de la Éditeur avancé. Pour plus d'informations sur ces propriétés, consultez la section Transformation de regroupement approximatif dans Transformation Custom Properties.
Pour en savoir plus sur la transformation de regroupement approximatif, consultez Fuzzy Grouping Transformation.
Options
Nom de la colonne clé d'entrée
Spécifiez le nom d'une colonne de sortie qui contient l'identificateur unique de chaque ligne d'entée. La colonne _key_in
a un nom qui identifie chaque ligne de manière unique.
Nom de la colonne clé de sortie
Spécifiez le nom d'une colonne de sortie qui contient l'identificateur unique de la ligne canonique d'un groupe de lignes dupliquées. La colonne _key_out
correspond à la valeur _key_in
de la ligne de données canonique.
Nom de colonne du score de similarité
Spécifiez un nom qui contient le score de similarité. Le score de similarité est une valeur comprise entre 0 et 1 qui indique le niveau de similarité avec la ligne canonique. Plus le score se rapproche de 1, plus la ligne correspond à la ligne canonique.
Seuil de similarité
Définissez le seuil de similarité au moyen du curseur. Plus le seuil est proche de 1, plus la similarité entre les lignes est grande pour se qualifier comme lignes dupliquées. L'augmentation du seuil peut accélérer les recherches du fait que moins de candidats doivent être évalués.
Séparateurs de jetons
La transformation fournit un ensemble de séparateurs par défaut pour marquer des données, mais vous devez ajouter ou supprimer des séparateurs en modifiant la liste en fonction des besoins.
Voir aussi
Guide de référence des erreurs et des messages propres à Integration Services
Identifier des lignes de données semblables à l'aide de la transformation de regroupement probable