FastTreeRegressionFeaturizationEstimator Classe
Definizione
Importante
Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.
Oggetto IEstimator<TTransformer> per trasformare il vettore di funzionalità di input in funzionalità basate su albero.
public sealed class FastTreeRegressionFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastTreeRegressionFeaturizationEstimator = class
inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastTreeRegressionFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
- Ereditarietà
Commenti
Colonne di input e output
I dati della colonna dell'etichetta di input devono essere Single. I dati delle colonne delle funzionalità di input devono essere un vettore di dimensioni note di Single.
Questo strumento di stima restituisce le colonne seguenti:
Nome colonna di output | Tipo di colonna | Descrizione |
---|---|---|
Trees |
Vettore di dimensioni note di Single | Valori di output di tutti gli alberi. La sua dimensione è identica al numero totale di alberi nel modello dell'insieme di alberi. |
Leaves |
Vettore di dimensioni note di Single | Rappresentazione vettoriale 0-1 agli ID di tutte le foglie in cui il vettore di funzionalità di input rientra. La sua dimensione è il numero di foglie totali nel modello dell'insieme di alberi. |
Paths |
Vettore di dimensioni note di Single | Rappresentazione vettoriale 0-1 nei percorsi passati dal vettore di funzionalità di input per raggiungere le foglie. La sua dimensione è il numero di nodi non foglia nel modello dell'insieme di alberi. |
Tali colonne di output sono tutte facoltative e gli utenti possono modificare i nomi. Impostare i nomi delle colonne ignorate su Null in modo che non vengano prodotti.
Dettagli stima
Questo strumento di stima produce diverse colonne di output da un modello di insieme ad albero. Si supponga che il modello contenga un solo albero delle decisioni:
Node 0
/ \
/ \
/ \
/ \
Node 1 Node 2
/ \ / \
/ \ / \
/ \ Leaf -3 Node 3
Leaf -1 Leaf -2 / \
/ \
Leaf -4 Leaf -5
Si supponga che il vettore di funzionalità di input rientra in Leaf -1
. L'output Trees
può essere un vettore di 1 elemento in cui l'unico valore è il valore decisionale trasportato da Leaf -1
. L'output Leaves
è un vettore 0-1. Se la foglia raggiunta è la $i$-th (indicizzata da $-(i+1)$ in modo che la prima foglia sia Leaf -1
) nell'albero, il valore $i$-th in Leaves
sarebbe 1 e tutti gli altri valori sarebbero 0. L'output Paths
è una rappresentazione 0-1 dei nodi passati prima di raggiungere la foglia. L'elemento $i$-th indica Paths
se viene toccato il nodo $i$-th (indicizzato da $i$).
Ad esempio, raggiungere Leaf -1
il lead a $[1, 1, 0, 0]$ come Paths
. Se ci sono più alberi, questo stimatore concatena Trees
solo 's, 's, 's Paths
da tutti gli alberi (Leaves
le informazioni del primo albero vengono prima nei vettori concatenati).
Controllare la sezione Vedere anche i collegamenti agli esempi di utilizzo.
Metodi
Fit(IDataView) |
Produrre un oggetto TreeEnsembleModelParameters che esegue il mapping della colonna chiamata InputColumnName in |
GetOutputSchema(SchemaShape) |
PretrainedTreeFeaturizationEstimator aggiunge tre colonne float-vector in |
Metodi di estensione
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training sui dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima dei training che accettano più passaggi di dati. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Dato un stimatore, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. Spesso è importante che un stimatore restituisca informazioni su ciò che è stato adatto, che è il motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> sono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di stima tramite EstimatorChain<TLastTransformer> dove lo stimatore per cui si vuole ottenere il trasformatore è sepolto da qualche parte in questa catena. Per questo scenario, è possibile collegare questo metodo a un delegato che verrà chiamato una volta che viene chiamato fit. |