ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)
|
WordEmbeddingEstimator미리 학습된 포함 모델을 사용하여 텍스트 벡터를 숫자 벡터로 변환하는 텍스트 기능화기인 을 만듭니다.
|
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)
|
WordEmbeddingEstimator미리 학습된 포함 모델을 사용하여 텍스트 벡터를 숫자 벡터로 변환하는 텍스트 기능화기인 를 만듭니다.
|
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])
|
TextFeaturizingEstimator텍스트 열을 n-gram 및 char-gram의 정규화된 개수를 나타내는 의 Single 주요 벡터로 변환하는 을 만듭니다.
|
FeaturizeText(TransformsCatalog+TextTransforms, String, String)
|
TextFeaturizingEstimator텍스트 열을 n-gram 및 char-gram의 정규화된 개수를 나타내는 의 Single 주요 벡터로 변환하는 를 만듭니다.
|
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String,
String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32,
Int32, Int32, Boolean)
|
LightLDA를 LatentDirichletAllocationEstimator사용하여 텍스트(floats의 벡터로 표시됨)를 식별된 각 항목과 텍스트의 유사성을 나타내는 벡터 Single 로 변환하는 을 만듭니다.
|
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)
|
TextNormalizingEstimator필요에 따라 대/소문자를 변경하여 들어오는 텍스트를 inputColumnName 정규화하는 를 만들고, 음수 표시, 문장 부호, 숫자를 제거하고 새 텍스트를 로 outputColumnName 출력합니다.
|
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)
|
NgramHashingEstimator에 지정된 inputColumnName 열의 데이터를 새 열 outputColumnName 로 복사하고 해시된 n-gram 개수의 벡터를 생성하는 를 만듭니다.
|
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)
|
NgramHashingEstimator에 지정된 inputColumnNames 여러 열에서 새 열 outputColumnName 로 데이터를 가져와 해시된 n-gram 개수의 벡터를 생성하는 를 만듭니다.
|
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)
|
WordHashBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName 새 열의 해시된 n-gram 수 벡터에 매핑하는 을 만듭니다.
|
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)
|
WordHashBagEstimator에 지정된 inputColumnNames 여러 열을 라는 outputColumnName 새 열의 해시된 n-gram 수 벡터에 매핑하는 을 만듭니다.
|
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
|
NgramExtractingEstimator 입력 텍스트에서 발생하는 n-gram(연속 단어 시퀀스)의 벡터를 생성하는 을 만듭니다.
|
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)
|
WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName 새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.
|
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
|
WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName 새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.
|
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
|
WordBagEstimator에 지정된 inputColumnNames 여러 열을 라는 outputColumnName 새 열의 n-gram 개수 벡터에 매핑하는 을 만듭니다.
|
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)
|
CustomStopWordsRemovingEstimator에 지정된 inputColumnName 열의 데이터를 새 열 outputColumnName 로 복사하고 에 해당하는 미리 정의된 텍스트 집합을 language 제거하는 를 만듭니다.
|
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])
|
에 CustomStopWordsRemovingEstimator지정된 inputColumnName 열의 데이터를 새 열 outputColumnName 로 복사하고 에 지정된 텍스트를 제거하는 를 stopwords 만듭니다.
|
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)
|
슬라이딩 윈도우를 TokenizingByCharactersEstimator사용하여 텍스트를 문자 시퀀스로 분할하여 토큰화하는 을 만듭니다.
|
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])
|
WordTokenizingEstimator를 구분 기호로 사용하여 separators 입력 텍스트를 토큰화하는 을 만듭니다.
|