다음을 통해 공유


Table.AddFuzzyClusterColumn

통사론

Table.AddFuzzyClusterColumn(table as table, columnName as text, newColumnName as text, optional options as nullable record) as table

소개

새로운 열 newColumnName을(를) table에 추가하여 columnName의 대표 값을 사용합니다. 각 행의 값을 columnName에서 유사하게 일치시켜 대리 항목들을 얻습니다.

키 열을 비교하는 방법을 지정하기 위해 선택적 options 집합을 포함할 수 있습니다. 옵션은 다음과 같습니다.

  • Culture: 문화권별 규칙에 따라 레코드를 그룹화할 수 있습니다. 유효한 문화 이름일 수 있습니다. 예를 들어 "ja-JP"의 Culture 옵션은 일본 문화권에 따라 레코드를 그룹화합니다. 기본값은 "Invariant English 문화"에 따라 그룹화되는 값입니다.
  • IgnoreCase: 대/소문자를 구분하지 않는 키 그룹화가 가능한 논리적(true/false) 값입니다. 예를 들어 true인 경우 "Grapes"는 "grapes"로 그룹화됩니다. 기본값은 true입니다.
  • IgnoreSpace: 그룹을 찾기 위해 텍스트 부분을 결합할 수 있는 논리적(true/false) 값입니다. 예를 들어 true인 경우 "Gra pes"는 "Grapes"로 그룹화됩니다. 기본값은 true입니다.
  • SimilarityColumnName: 입력 값과 해당 입력의 대표 값 사이의 유사성을 보여 주는 열의 이름입니다. 기본값은 null이며, 이 경우 유사성에 대한 새 열이 추가되지 않습니다.
  • Threshold: 두 값을 그룹화할 유사성 점수를 지정하는 0.00에서 1.00 사이의 숫자입니다. 예를 들어 "Grapes" 및 "Graes"("p" 누락)는 이 옵션이 0.90 미만으로 설정된 경우에만 함께 그룹화됩니다. 임계값 1.00은 정확한 일치만 허용합니다. (유사하게 "정확한 일치"는 대/소문자, 단어 순서 및 문장 부호와 같은 차이를 무시할 수 있습니다.) 기본값은 0.80입니다.
  • TransformationTable: 사용자 지정 값 매핑에 따라 레코드를 그룹화할 수 있는 테이블입니다. "From" 및 "To" 열을 포함해야 합니다. 예를 들어, 변환 테이블에서 "From" 열에 "Grapes"가, "To" 열에 "Raisins"가 포함되어 있으면, "Grapes"는 "Raisins"와 같은 그룹으로 묶입니다. 변환 테이블의 텍스트의 모든 항목에 변환이 적용됩니다. 위의 변환 표에서 "포도는 달콤하다"는 "건포도는 달콤하다"와 같은 그룹으로 묶일 것입니다.

예제 1

직원의 위치에 대한 대표 값을 찾습니다.

사용량

Table.AddFuzzyClusterColumn(
    Table.FromRecords(
        {
            [EmployeeID = 1, Location = "Seattle"],
            [EmployeeID = 2, Location = "seattl"],
            [EmployeeID = 3, Location = "Vancouver"],
            [EmployeeID = 4, Location = "Seatle"],
            [EmployeeID = 5, Location = "vancover"],
            [EmployeeID = 6, Location = "Seattle"],
            [EmployeeID = 7, Location = "Vancouver"]
        },
        type table [EmployeeID = nullable number, Location = nullable text]
    ),
    "Location",
    "Location_Cleaned",
    [IgnoreCase = true, IgnoreSpace = true]
)

출력

Table.FromRecords(
    {
        [EmployeeID = 1, Location = "Seattle", Location_Cleaned = "Seattle"],
        [EmployeeID = 2, Location = "seattl", Location_Cleaned = "Seattle"],
        [EmployeeID = 3, Location = "Vancouver", Location_Cleaned = "Vancouver"],
        [EmployeeID = 4, Location = "Seatle", Location_Cleaned = "Seattle"],
        [EmployeeID = 5, Location = "vancover", Location_Cleaned = "Vancouver"],
        [EmployeeID = 6, Location = "Seattle", Location_Cleaned = "Seattle"],
        [EmployeeID = 7, Location = "Vancouver", Location_Cleaned = "Vancouver"]
    },
    type table [EmployeeID = nullable number, Location = nullable text, Location_Cleaned = nullable text]
)