fastForest: fastForest
Erstellt eine Liste mit dem Funktionsnamen und den Argumenten zum Trainieren eines FastForest-Modells mit rxEnsemble.
Verwendung
fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
trainThreads = 8, randomSeed = NULL, ...)
Argumente
numTrees
Gibt die Gesamtanzahl von Entscheidungsstrukturen an, die im Ensemble erstellt werden sollen. Mit einer höheren Anzahl von Entscheidungsstrukturen erzielen Sie u. U. eine bessere Abdeckung, allerdings verlängert sich dadurch auch die Trainingsdauer. Der Standardwert ist 100.
numLeaves
Die maximale Anzahl von Blättern (Endknoten) an, die in einem Baum erstellt werden können. Höhere Werte können zwar den Baum vergrößern und die Genauigkeit verbessern, bergen aber das Risiko einer Überanpassung und erfordern längere Trainingszeiten. Der Standardwert lautet 20.
minSplit
Mindestanzahl von Trainingsinstanzen an, die für die Erstellung eines Blatts erforderlich sind. Das heißt, die minimale Anzahl von Dokumenten, die in einem Blatt eines Regressionsbaums aus den Daten mit untergeordneten Stichproben zulässig sind. Eine „Aufteilung“ bedeutet, dass Features auf jeder Ebene des Baums (Knotens) zufällig aufgeteilt werden. Der Standardwert ist 10.
exampleFraction
Der Anteil zufällig gewählter Instanzen, die für jeden Baum verwendet werden sollen. Der Standardwert ist 0,7.
featureFraction
Der Anteil zufällig gewählter Features, die für jeden Baum verwendet werden sollen. Der Standardwert ist 0,7.
splitFraction
Der Anteil zufällig gewählter Features, die für jede Aufteilung verwendet werden sollen. Der Standardwert ist 0,7.
numBins
Maximale Anzahl unterschiedlicher Werte (Bins) pro Feature. Der Standardwert ist 255.
firstUsePenalty
Das Feature verwendet zuerst den Strafkoeffizienten. Der Standardwert ist 0.
gainConfLevel
Konfidenzanforderung für die Baumanpassung (muss im Bereich [0,1] liegen). Der Standardwert ist 0.
trainThreads
Die Anzahl der Threads zum Trainieren des Modells. Falls NULL
angegeben wird, wird die Anzahl der zu verwendenden Threads intern bestimmt. Der Standardwert ist NULL
.
randomSeed
Gibt den zufälligen Ausgangswert an. Der Standardwert ist NULL
.
...
Zusätzliche Argumente.