Éditeur de transformation de regroupement probable (onglet Avancé).

Article
06/13/2017

Utilisez l'onglet Avancé de la boîte de dialogue Éditeur de transformation de regroupement probable pour spécifier les colonnes d'entrée et de sortie, définir des seuils de similarité et des séparateurs.

Notes

Les Exhaustive propriétés et MaxMemoryUsage de la transformation de regroupement flou ne sont pas disponibles dans l’éditeur de transformation de regroupement flou, mais peuvent être définies à l’aide de la Éditeur avancé. Pour plus d'informations sur ces propriétés, consultez la section Transformation de regroupement approximatif dans Transformation Custom Properties.

Pour en savoir plus sur la transformation de regroupement approximatif, consultez Fuzzy Grouping Transformation.

Options

Nom de la colonne clé d'entrée
Spécifiez le nom d'une colonne de sortie qui contient l'identificateur unique de chaque ligne d'entée. La colonne _key_in a un nom qui identifie chaque ligne de manière unique.

Nom de la colonne clé de sortie
Spécifiez le nom d'une colonne de sortie qui contient l'identificateur unique de la ligne canonique d'un groupe de lignes dupliquées. La colonne _key_out correspond à la valeur _key_in de la ligne de données canonique.

Nom de colonne du score de similarité
Spécifiez un nom qui contient le score de similarité. Le score de similarité est une valeur comprise entre 0 et 1 qui indique le niveau de similarité avec la ligne canonique. Plus le score se rapproche de 1, plus la ligne correspond à la ligne canonique.

Seuil de similarité
Définissez le seuil de similarité au moyen du curseur. Plus le seuil est proche de 1, plus la similarité entre les lignes est grande pour se qualifier comme lignes dupliquées. L'augmentation du seuil peut accélérer les recherches du fait que moins de candidats doivent être évalués.

Séparateurs de jetons
La transformation fournit un ensemble de séparateurs par défaut pour marquer des données, mais vous devez ajouter ou supprimer des séparateurs en modifiant la liste en fonction des besoins.

Voir aussi

Guide de référence des erreurs et des messages propres à Integration Services
Identifier des lignes de données semblables à l'aide de la transformation de regroupement probable

Partager via

Éditeur de transformation de regroupement probable (onglet Avancé).

Options

Voir aussi

Ressources supplémentaires