다음을 통해 공유


fastTrees: fastTrees

rxEnsemble을 사용하여 FastTree 모델을 학습시키기 위한 함수 이름과 인수를 포함하는 목록을 만듭니다.

사용

  fastTrees(numTrees = 100, numLeaves = 20, learningRate = 0.2,
    minSplit = 10, exampleFraction = 0.7, featureFraction = 1,
    splitFraction = 1, numBins = 255, firstUsePenalty = 0,
    gainConfLevel = 0, unbalancedSets = FALSE, trainThreads = 8,
    randomSeed = NULL, ...)
 

인수

numTrees

앙상블에서 만들 의사 결정 트리의 총 수를 지정합니다. 더 많은 의사 결정 트리를 만들면 적용 범위가 확대될 수 있지만 학습 시간이 늘어나게 됩니다. 기본값은 100입니다.

numLeaves

임의의 트리에서 만들 수 있는 리프(터미널 노드)의 최대 개수. 값이 클수록 트리의 크기가 증가하고 정밀도가 향상될 수 있지만, 과잉 맞춤으로 인해 학습 시간이 길어질 위험이 있습니다. 기본값은 20입니다.

learningRate

학습 프로세스의 각 단계에서 경사 방향으로 수행되는 단계의 크기를 결정합니다. 이는 학습자가 최적 솔루션에 얼마나 빠르게 또는 느리게 수렴하는지 결정합니다. 단계 크기가 너무 크면 최적 솔루션을 초과할 수 있습니다. 단계 크기가 너무 작으면 학습이 최적 솔루션으로 수렴하는 데 걸리는 시간이 길어집니다.

minSplit

리프를 만드는 데 필요한 최소 학습 인스턴스 수. 즉, 하위 샘플링된 데이터 중 회귀 트리의 리프에서 허용되는 최소 문서 수입니다. ‘분할’은 트리(노드)의 각 수준에 있는 기능이 임의로 분할됨을 의미합니다. 기본값은 10입니다. 인스턴스에 가중치가 있는 경우에도 인스턴스의 수만 계산됩니다.

exampleFraction

각 트리에 사용할 임의로 선택된 인스턴스의 비율. 기본값은 0.7입니다.

featureFraction

각 트리에 사용할 임의로 선택된 기능의 비율. 기본값은 1입니다.

splitFraction

각 분할에 사용할 임의로 선택된 기능의 비율. 기본값은 1입니다.

numBins

기능당 고유한 값(bin)의 최대 개수. 기능에 표시된 것보다 적은 수의 값이 있는 경우 각 값은 자체 bin에 배치됩니다. 더 많은 값이 있는 경우 알고리즘은 numBins bin을 만듭니다.

firstUsePenalty

이 기능은 먼저 페널티 계수를 사용합니다. 트리를 만들 때 새 기능을 사용할 경우 페널티가 발생하는 정규화의 한 형태입니다. 많은 기능을 사용하지 않는 트리를 만들려면 이 값을 늘립니다. 기본값은 0입니다.

gainConfLevel

트리 맞춤 신뢰도 얻기 요구 사항([0,1) 범위에 있어야 함). 기본값은 0입니다.

unbalancedSets

TRUE인 경우 불균형 집합에 최적화된 파생이 사용됩니다. type"binary"인 경우에만 적용할 수 있습니다. 기본값은 FALSE입니다.

trainThreads

학습에 사용할 스레드의 수. 기본값은 8입니다.

randomSeed

임의의 시드를 지정합니다. 기본값은 NULL입니다.

...

추가 인수입니다.