Editor de Transformação Agrupamento Difuso (guia Avançado)
Use a guia Avançado da caixa de diálogo Editor de Transformação Agrupamento Difuso para especificar colunas de entrada e saída, definir limites de similaridade e definir delimitadores.
Observação
As Exhaustive
propriedades e MaxMemoryUsage
da transformação Agrupamento Difuso não estão disponíveis no Editor de Transformação Agrupamento Difuso, mas podem ser definidas usando o Editor Avançado. Para obter mais informações sobre essas propriedades, consulte a seção Transformação Agrupamento Difuso em Transformation Custom Properties.
Para saber mais sobre a transformação Agrupamento Difuso, consulte Fuzzy Grouping Transformation.
Opções
Nome da coluna da chave de entrada
Especifique o nome de uma coluna de saída que contém o identificador exclusivo para cada coluna de entrada. A coluna _key_in
tem um valor que identifica exclusivamente cada linha.
Nome da coluna da chave de saída
Especifique o nome de uma coluna de saída que contém um identificador exclusivo para a linha canônica de um grupo de linhas duplicadas. A coluna _key_out
corresponde ao valor _key_in
da linha de dados canônica.
Nome da coluna de pontuação de similaridade
Especifique um nome para a coluna que contém a pontuação de similaridade. A pontuação de similaridade é um valor entre 0 e 1 que indica a similaridade da linha de entrada à linha canônica. Quanto mais próxima de 1 for a pontuação, mais próxima será a correspondência da fila com a fila canônica.
Limite de similaridade
Defina o limite de similaridade usando o controle deslizante. Quanto mais próximo de 1 for o limite, mais linhas deverão ser similares umas às outras para se qualificarem como duplicatas. Aumentar o limite pode melhorar a velocidade de correspondência, pois menos registros candidatos precisam ser considerados.
Delimitadores de token
A transformação fornece um conjunto padrão de delimitadores para criar tokens de dados, mas você pode adicionar ou remover delimitadores, conforme a necessidade, editando a lista.
Consulte Também
Referência de mensagens e erros do Integration Services
Identificar linhas de dados semelhantes por meio da transformação Agrupamento Difuso