다음을 통해 공유


TransformsCatalog.TextTransforms 클래스

정의

에서 MLContext 텍스트 데이터 변환 구성 요소의 인스턴스를 만드는 데 사용하는 클래스입니다.

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
상속
TransformsCatalog.TextTransforms

확장 메서드

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

WordEmbeddingEstimator미리 학습된 포함 모델을 사용하여 텍스트 벡터를 숫자 벡터로 변환하는 텍스트 기능화기인 을 만듭니다.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

WordEmbeddingEstimator미리 학습된 포함 모델을 사용하여 텍스트 벡터를 숫자 벡터로 변환하는 텍스트 기능화기인 를 만듭니다.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

TextFeaturizingEstimator텍스트 열을 n-gram 및 char-gram의 정규화된 개수를 나타내는 의 Single 주요 벡터로 변환하는 을 만듭니다.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

TextFeaturizingEstimator텍스트 열을 n-gram 및 char-gram의 정규화된 개수를 나타내는 의 Single 주요 벡터로 변환하는 를 만듭니다.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

LightLDALatentDirichletAllocationEstimator사용하여 텍스트(floats의 벡터로 표시됨)를 식별된 각 항목과 텍스트의 유사성을 나타내는 벡터 Single 로 변환하는 을 만듭니다.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

TextNormalizingEstimator필요에 따라 대/소문자를 변경하여 들어오는 텍스트를 inputColumnName 정규화하는 를 만들고, 음수 표시, 문장 부호, 숫자를 제거하고 새 텍스트를 로 outputColumnName출력합니다.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

NgramHashingEstimator에 지정된 inputColumnName 열의 데이터를 새 열 outputColumnName 로 복사하고 해시된 n-gram 개수의 벡터를 생성하는 를 만듭니다.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

NgramHashingEstimator에 지정된 inputColumnNames 여러 열에서 새 열 outputColumnName 로 데이터를 가져와 해시된 n-gram 개수의 벡터를 생성하는 를 만듭니다.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 해시된 n-gram 수 벡터에 매핑하는 을 만듭니다.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimator에 지정된 inputColumnNames 여러 열을 라는 outputColumnName새 열의 해시된 n-gram 수 벡터에 매핑하는 을 만듭니다.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

NgramExtractingEstimator 입력 텍스트에서 발생하는 n-gram(연속 단어 시퀀스)의 벡터를 생성하는 을 만듭니다.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator에 지정된 inputColumnNames 여러 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 을 만듭니다.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

CustomStopWordsRemovingEstimator에 지정된 inputColumnName 열의 데이터를 새 열 outputColumnName 로 복사하고 에 해당하는 미리 정의된 텍스트 집합을 language 제거하는 를 만듭니다.

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

CustomStopWordsRemovingEstimator지정된 inputColumnName 열의 데이터를 새 열 outputColumnName 로 복사하고 에 지정된 텍스트를 제거하는 를 stopwords 만듭니다.

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

슬라이딩 윈도우를 TokenizingByCharactersEstimator사용하여 텍스트를 문자 시퀀스로 분할하여 토큰화하는 을 만듭니다.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

WordTokenizingEstimator를 구분 기호로 사용하여 separators 입력 텍스트를 토큰화하는 을 만듭니다.

적용 대상