Udostępnij za pośrednictwem


Jak Identyfikowanie podobne wiersze danych przy użyciu transformacji grupowania rozmyte

Aby dodać i skonfigurować transformacja rozmyte grupowania, pakiet już musi zawierać co najmniej jedno zadanie przepływu danych i źródło.

Aby zaimplementować rozmyte grupowania transformacja w przepływ danych

  1. W Business Intelligence Development Studio, otwórz Integration Services Projekt, który zawiera pakiet możesz chcieć.

  2. W oknie Solution Explorer kliknij dwukrotnie pakiet, aby go otworzyć.

  3. Kliknij Przepływu danych kartę, a następnie z Przybornik, przeciągnij transformacja rozmyte grupowania do powierzchni projektu.

  4. Połączyć transformacja rozmyte grupowania przepływ danych przez przeciąganie łącznika — czerwoną lub zieloną strzałkę — ze źródło danych lub poprzedniego transformacja do przemian rozmyte grupowania.

  5. Kliknij dwukrotnie transformacja rozmyte grupowania.

  6. W Edytor transformacji grupowania rozmyte dialogowym na menedżer połączeń , następnie wybierz menedżer połączeń OLE DB, który łączy się z SQL Server bazy danych.

    Ostrzeżenie

    transformacja wymaga połączenia do SQL Server bazy danych do tworzenia tabel tymczasowych i indeksy.

  7. Kliknij kolumny kartę i w Dostępne kolumny danych wejściowych listy, zaznacz pole wyboru wprowadzania kolumn w celu identyfikacji podobne wierszy w zestawie danych.

  8. Zaznacz pole wyboru w Przekazujące kolumna do identyfikowania wprowadzania kolumna, aby przechodzić do wynik transformacja.Kolumny typu pass-through nie są uwzględniane w procesie identyfikacji zduplikowane wiersze.

    Ostrzeżenie

    Wejściowe kolumn, które są używane do grupowanie są automatycznie wybrany jako kolumny przekazujących i nie może być niezaznaczone natomiast używane do grupowanie.

  9. Opcjonalnie można zaktualizować nazwy kolumn wyjściowych w Alias wyjście kolumna.

  10. Optionally, update the names of cleaned columns in the Group OutputAlias column.

    Ostrzeżenie

    Domyślne nazwy kolumn są nazwami kolumn danych wejściowych z "_clean" sufiks.

  11. Opcjonalnie, zaktualizuj typ dopasowania w Typ dopasowania kolumna.

    Ostrzeżenie

    Należy użyć co najmniej jedną kolumnę dopasowywanie rozmyte.

  12. Określanie kolumn poziom podobieństwa minimalne w Minimalne podobieństwa kolumna.Wartość musi być między 0 i 1.Im bliżej wartości jest 1, tym bardziej podobne wartości w kolumnach wejściowego musi być do utworzenia grupy.Minimalne podobieństwa 1 wskazuje dokładne dopasowanie.

  13. Opcjonalnie można zaktualizować nazwy kolumn podobieństwa Alias wyjścia podobieństwa kolumna.

  14. Aby określić obsługi numerów w wartości danych, zaktualizować wartości w cyfry kolumna.

  15. Aby określić, jak transformacja porównuje dane ciąg kolumna, należy zmodyfikować ustawienie domyślne opcje porównywania w Porównania flagi kolumna.

  16. Kliknij Zaawansowane kartę, aby zmodyfikować nazwy kolumn, które dodaje transformacja danych wyjściowych dla wiersza unikatowy identyfikator (_key_in), identyfikator zduplikowany wiersz (_key_out) i wartość podobieństwa (_score).

  17. Opcjonalnie można dostosować próg podobieństwa przesuwając suwak.

  18. Opcjonalnie wyczyść pole wyboru token ogranicznik ignorowanie ograniczniki w danych.

  19. Click OK.

  20. Aby zapisać zaktualizowany pakiet, kliknij Zapisać wybrane elementy na pliku menu.