Jak Identyfikowanie podobne wiersze danych przy użyciu transformacji grupowania rozmyte
Aby dodać i skonfigurować transformacja rozmyte grupowania, pakiet już musi zawierać co najmniej jedno zadanie przepływu danych i źródło.
Aby zaimplementować rozmyte grupowania transformacja w przepływ danych
W Business Intelligence Development Studio, otwórz Integration Services Projekt, który zawiera pakiet możesz chcieć.
W oknie Solution Explorer kliknij dwukrotnie pakiet, aby go otworzyć.
Kliknij Przepływu danych kartę, a następnie z Przybornik, przeciągnij transformacja rozmyte grupowania do powierzchni projektu.
Połączyć transformacja rozmyte grupowania przepływ danych przez przeciąganie łącznika — czerwoną lub zieloną strzałkę — ze źródło danych lub poprzedniego transformacja do przemian rozmyte grupowania.
Kliknij dwukrotnie transformacja rozmyte grupowania.
W Edytor transformacji grupowania rozmyte dialogowym na menedżer połączeń , następnie wybierz menedżer połączeń OLE DB, który łączy się z SQL Server bazy danych.
Ostrzeżenie
transformacja wymaga połączenia do SQL Server bazy danych do tworzenia tabel tymczasowych i indeksy.
Kliknij kolumny kartę i w Dostępne kolumny danych wejściowych listy, zaznacz pole wyboru wprowadzania kolumn w celu identyfikacji podobne wierszy w zestawie danych.
Zaznacz pole wyboru w Przekazujące kolumna do identyfikowania wprowadzania kolumna, aby przechodzić do wynik transformacja.Kolumny typu pass-through nie są uwzględniane w procesie identyfikacji zduplikowane wiersze.
Ostrzeżenie
Wejściowe kolumn, które są używane do grupowanie są automatycznie wybrany jako kolumny przekazujących i nie może być niezaznaczone natomiast używane do grupowanie.
Opcjonalnie można zaktualizować nazwy kolumn wyjściowych w Alias wyjście kolumna.
Optionally, update the names of cleaned columns in the Group OutputAlias column.
Ostrzeżenie
Domyślne nazwy kolumn są nazwami kolumn danych wejściowych z "_clean" sufiks.
Opcjonalnie, zaktualizuj typ dopasowania w Typ dopasowania kolumna.
Ostrzeżenie
Należy użyć co najmniej jedną kolumnę dopasowywanie rozmyte.
Określanie kolumn poziom podobieństwa minimalne w Minimalne podobieństwa kolumna.Wartość musi być między 0 i 1.Im bliżej wartości jest 1, tym bardziej podobne wartości w kolumnach wejściowego musi być do utworzenia grupy.Minimalne podobieństwa 1 wskazuje dokładne dopasowanie.
Opcjonalnie można zaktualizować nazwy kolumn podobieństwa Alias wyjścia podobieństwa kolumna.
Aby określić obsługi numerów w wartości danych, zaktualizować wartości w cyfry kolumna.
Aby określić, jak transformacja porównuje dane ciąg kolumna, należy zmodyfikować ustawienie domyślne opcje porównywania w Porównania flagi kolumna.
Kliknij Zaawansowane kartę, aby zmodyfikować nazwy kolumn, które dodaje transformacja danych wyjściowych dla wiersza unikatowy identyfikator (_key_in), identyfikator zduplikowany wiersz (_key_out) i wartość podobieństwa (_score).
Opcjonalnie można dostosować próg podobieństwa przesuwając suwak.
Opcjonalnie wyczyść pole wyboru token ogranicznik ignorowanie ograniczniki w danych.
Click OK.
Aby zapisać zaktualizowany pakiet, kliknij Zapisać wybrane elementy na pliku menu.