次の方法で共有


データ統一のためのマッチングルールの定義

統合のこの手順では、テーブル間照合の一致順序とルールを定義します。 この手順には少なくとも 2 つのテーブルが必要です。 レコードが一致すると、各テーブルのすべてのフィールドを含む 1 つのレコードに連結されます。 代替行 (重複排除ステップからの非勝者行) は、照合時に考慮されます。 ただし、行がテーブル内の代替行と一致する場合、レコードは勝者の行と一致します。

注意

一致条件を作成して 次へ を選択すると、選択したテーブルや列を削除することはできません。 必要に応じて、戻る を選択し、選択したテーブルと列を確認してから続行します。

次の手順と画像は、統合プロセスを初めて実行したときのものです。 既存の統合設定を編集するには、統合設定を更新するを参照してください。

エンリッチしたテーブルを含める (プレビュー)

統合結果を改善するためにデータ ソース レベルでテーブルをエンリッチした場合は、それらを選択します。 詳細については、データ ソースのエンリッチメント を参照してください。 重複排除ルール ページ でエンリッチ テーブルを選択した場合は、再度選択する必要はありません。

  1. マッチング ルールページで、ページ上部の 強化されたテーブルを使用する を選択します。

  2. エンリッチしたテーブルを使用する ペインから、1 つ以上のエンリッチされたテーブルを選択します。

  3. 完了を選択します。

一致順を指定します。

各照合では、2 つ以上のテーブルを単一の連結テーブルに統合します。 同時に、一意の顧客レコードを保持します。 照合順序はシステムがレコードの照合を行う順序を示します。

重要

最初のテーブルは主テーブルと呼ばれ、統合されたプロファイルの基盤として機能します。 選択された追加のテーブルが、このテーブルに追加されます。

重要な考慮事項:

  • 主テーブルとして、顧客に関する最も完全で信頼性の高いプロファイル データを含むテーブルを選択します。
  • 他のテーブルと共通のカラムをいくつか持つテーブル (たとえば、名前、電話番号、メールアドレスなど) を主テーブルとして選択します。
  • テーブルは、優先度の高い他のテーブルとのみ照合できます。 したがって、Table2 は Table1 とのみ一致し、Table3 は Table2 または Table1 と一致することができます。
  1. マッチング ルール ページで、上下の矢印を使ってテーブルを好きな順番に移動するか、ドラッグ アンド ドロップします。 たとえば、主テーブルとして eCommerceCustomers を選択し、2 番目のテーブルとして loyCustomers を選択します。

  2. 一致するものが見つかったかどうかに関係なく、テーブルが含むすべてのレコードを一意の顧客として保持するには、すべてのレコードを含める を選択します。 他のテーブルのレコードと一致しないこのテーブルのレコードは、統合プロファイルに含まれます。 一致しないレコードはシングルトンと呼ばれます。

主テーブル Contacts:eCommerce は次のテーブル CustomerLoyalty:Loyalty と一致します。 2 つ以上のテーブルがある場合、最初の照合ステップの結果であるデータセットは、次のテーブルと一致します。 eCommerceContacts に重複がまだ存在する場合 、loyCustomereCommerceContacts と一致すれば、 eCommerceContacts 重複行は 1 つの顧客レコードに縮小されません。 ただし、loyCustomer の重複行が eCommerceContacts の行と一致する場合、それらは 1 つの顧客レコードに縮小されます。。

テーブルに対して選択された一致順序のスクリーンショット。

照合ペアのルールを定義する

一致ルールは、テーブルの特定のペアが一致するロジックを指定します。 ルールは、1 つ以上の条件で構成されます。

テーブル名の横にある警告は、一致ペアに対して一致ルールが定義されていないことを意味します。

  1. 一致ルールを定義するには、テーブル ペアに対してルールの追加を選択します。

  2. ルールの追加ウインドウで、ルールの条件を構成します。

    ルールの追加ウィンドウのスクリーンショット。

    • テーブル/フィールドの選択 (最初の行): 顧客固有のテーブルと列を選択します。 たとえば、電話番号や電子メール アドレスなどです。 アクティビティ タイプの列によるマッチングは避けてください。 たとえば、購入 ID は、他のレコードの種類では一致しない可能性があります。

    • テーブル/フィールドの選択 (2 番面目の行): 最初の行で指定したテーブルの列に関連する列を選択します。

    • 正規化: 列の正規化オプションを選択します。

      正規化 使用例
      数字 数値を表す多くの Unicode 記号を単純な数値に変換します。
      例: ❽ と Ⅷ は両方とも数値 8 に正規化されます。
      注意: シンボルは Unicode ポイント形式でエンコードする必要があります。
      シンボル 記号と特殊文字を削除します。
      例: !?"#$%&'( )+,.-/:;<=>@^~{}`[ ]
      テキストから小文字 大文字を小文字に変換します。 
      例: 「THIS Is aN EXamplE」 は 「this is an example」 に変換されます
      タイプ – 電話 さまざまな形式の電話を数字に変換し、国番号と内線番号の表示方法の違いを考慮します。 記号と空白は無視されます。 国コードの先頭の「0」は無視され、+1 と +01 が一致します。 文字の接頭辞で示される拡張子は無視されます (X 123)。 正規化された国コードは重要で ある ため、国コードのある電話は、国番号のない電話とは一致しません。
      例: +01 425.555.1212 は 1 (425) 555-1212 と一致します。
      +01 425.555.1212 は (425) 555-1212 と一致しません
      タイプ - 名前 500 を超える一般的な名前のバリエーションとタイトルを変換します。 
      例 : 「debby」 -> 「deborah」 「prof」 および 「professor」 -> 「Prof.」
      タイプ - 住所 アドレスの共通部分を変換する
      例: 「street」 -> 「st」、「northwest」 -> 「nw」
      タイプ - 組織 「co」、「corp」、「corporation」、「ltd」 など、約 50 の会社名の「ノイズ ワード」を削除します。
      Unicode から ASCII Unicode 文字列を、同等の ASCII 文字に変換する
      例: 文字 「à」、「á」、「â」、「À」、「Á」、「Â」、「Ã」、「Ä」、「Ⓐ」、「A」 はすべて 「a」 に変換されます。
      空白 すべての空白スペースを削除する
      エイリアス マッピング 常に完全一致とみなされるべき文字列を示すために使用できる文字列ペアのカスタム リストをアップロードできます。 
      一致する必要があると思われる特定のデータ例があり、他の正規化パターンのいずれかを使用しても一致しない場合は、エイリアス マッピングを使用します。 
      例: Scott と Scooter、MSFT と Microsoft。
      カスタムのバイパス 一致すべきではない文字列を示すために使用できる文字列のカスタム リストをアップロードできます。
      カスタム バイパスは、ダミーの電話番号やダミーのメールなど、無視する必要がある一般的な値を持つデータがある場合に便利です。 
      例: 電話番号 555-1212、または test@contoso.com とは決して一致しない
    • 精度: この条件に適用する精度のレベルを設定します。 精度は、完全一致とあいまい一致に使用され、一致と見なされるために 2 つの文字列がどの程度近づく必要があるかを決定します。

      • 基本: 低 (30%)中 (60%)高 (80%)完全一致t (100%) から選択します。 100%一致するレコードのみを一致とする場合は 完全一致 を選択します。
      • カスタム: レコードが一致する必要がある割合を設定します。 システムは、このしきい値を超えるレコードのみを照合します。
    • 名前: ルールの名前です。

  3. カラムが複数の条件を満たす場合にのみテーブルを一致させるには、追加>条件の追加 を選択して一致規則に条件を追加します。 条件は論理 AND 演算子で接続されるため、すべての条件が満たされた場合にのみ実行されます。

  4. 必要に応じて、例外 またはカスタム一致条件 などの高度なオプションを検討してください。

  5. 完了を選択してルールを終了します。

  6. オプションで、ルールをさらに追加 します。

  7. 次へを選択します。

照合ペアにルールを追加する

照合ルールは条件セットを表します。 複数の列に基づく条件でテーブルをマッチさせるには、さらにルールを追加します。

  1. ルールを追加するテーブルで ルールの追加 を選択します。

  2. 照合ペアのルールを定義する の手順に従います。

Note

ルールの順序は重要です。 照合アルゴリズムは、最初のルールに基づいて特定の顧客レコードを一致しようと試み、最初のルールで一致が識別されなかった場合にのみ 2 番目のルールに進みます。

詳細オプション

ルールに例外を追加する

ほとんどの場合、テーブルの照合により、統合されたデータを持つ一意の顧客プロファイルが作成されます。 偽陽性や偽陰性のまれなケースに対処するために、照合ルールの例外を定義します。 例外は、照合ルールの処理後に適用され、例外条件を満たすレコードすべての照合を回避します。

たとえば、照合ルールが姓、都市、および生年月日を組み合わせている場合、システムは、同じプロファイルと同じ町に住んでいる同じ姓を持つ双子を識別します。 結合するテーブルが含む名が同じでない場合は、プロファイルに一致しない例外を指定できます。

  1. ルールの編集ウィンドウで、追加>例外の追加を選択します。

  2. 例外条件を指定します。

  3. 完了 を選択してルールを保存します。

カスタム照合条件の指定

既定の照合ロジックをオーバーライドする条件を指定します。 次の 4 つのオプションを使用できます。

回答内容 説明設定
常に照合する 常に照合される主キーの値を定義します。 常に、主キーが 12345 の行と主キーが 54321 の行を照合します。
照合しない 照合しない主キーの値を定義します。 主キーが 12345 の行と主キーが 54321 の行を照合しません。
バイパス システムが照合フェーズで常に無視するべき値を定義します。 照合中に 11111Unknown の値を無視します。
エイリアス マッピング システムが同じ値と見なすべき値を定義します。 JoeJoseph と等しいと見なします。
  1. カスタムを選択します。

    カスタム ボタン

  2. カスタム タイプを選択し、テンプレートのダウンロードを選択します。 スペースを使用せずにテンプレートの名前を変更します。 照合オプションごとに個別のテンプレートを使用します。

  3. ダウンロードしたテンプレート ファイルを開き、詳細を入力します。 テンプレートには、カスタム照合で使用されるテーブルとテーブルの主キーの値を指定するフィールドが含まれています。 テーブル名は大文字と小文字が区別されます。 たとえば、営業 テーブルの主キー 12345連絡先 テーブルの主キー 34567 と常に一致させる場合は、テンプレートに次のように入力します:

    • Table1: 営業
    • Table1Key: 12345
    • Table2: 連絡先
    • Table2Key: 34567

    同じテンプレート ファイルで、複数のテーブルからカスタム一致レコードを指定できます。

    テーブルの重複排除にカスタム照合を指定する場合は、Table1 と Table2 の両方と同じテーブルを指定し、異なる主キー値を設定します。 カスタム照合を使用するには、少なくとも 1 つの重複排除規則をテーブルに定義する必要があります。

  4. オーバーライドをすべて追加してからテンプレート ファイルを保存します。

  5. データ>データ ソース に移動し、テンプレート ファイルを新しいテーブルとして取り込みます。

  6. ファイルをアップロードした後、カスタム オプションを再度選択します。 ドロップダウン メニューから必要なテーブルを選択し、完了 を選択します。

    カスタム照合シナリオに対する上書きを選択するダイアログのスクリーンショット。

  7. 使用する照合オプションにより、カスタム照合の適用が異なります。

    • 常に一致 または 常に不一致 の場合は次のステップに進みます。
    • バイパスまたはエイリアス マッピングの場合は、既存の照合ルールで編集を選択するか、新しいルールを作成します。 正規化ドロップダウンから カスタム バイパス または エイリアス マッピング オプションを選択してから、完了 を選択します。
  8. カスタム ウィンドウで完了を選択して、カスタム一致構成を適用します。

    取り込まれた各テンプレート ファイルは、独自のデータ ソースです。 特別な照合処理が必要なレコードが見つかった場合は、適切なデータ ソースを更新します。 更新は、次の統合プロセスで使用されます。 たとえば、1 人として統合された同じ住所に住むほぼ同じ名前の双子を識別します。 データ ソース を更新して、双子を個別の一意のレコードとして識別します。