Freigeben über


OneHotHashEncodingEstimator Klasse

Definition

Wandelt mindestens eine Eingabespalte von kategorisierten Werten in so viele Ausgabespalten von hashbasierten Vektoren um.

public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
    interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
Vererbung
OneHotHashEncodingEstimator
Implementiert

Hinweise

Stimatoreigenschaften

Muss dieser Schätzer die Daten untersuchen, um seine Parameter zu trainieren? Yes
Eingabespaltendatentyp Skalar oder Vektor numerischer, boolescher, Text oder Schlüsseltyp .
Ausgabespaltendatentyp Skalar oder Vektor des Schlüssels oder Vektor des Typs Single .
Exportierbar in ONNX No

Das resultierende OneHotEncodingTransformer Ergebnis konvertiert eine oder mehrere Eingabespalten in so viele Ausgabespalten von 1-hot-codierten Vektoren, wobei die Indizierung erfolgt, indem der Wert hasht und der Hash als Index verwendet wird.

Dies OneHotEncodingEstimator wird häufig verwendet, um kategorisierte Daten in ein Formular zu konvertieren, das einem Maschinellen Lernalgorithmus zur Verfügung gestellt werden kann.

Die Ausgabe dieser Transformation wird durch :OneHotEncodingEstimator.OutputKind

  • Indicator erzeugt einen Indikatorvektor. Jeder Slot in diesem Vektor entspricht einer Kategorie im Wörterbuch, sodass seine Länge der Größe des erstellten Wörterbuchs entspricht. Wenn ein Wert im Wörterbuch nicht gefunden wird, ist die Ausgabe der Nullvektor.

  • Bag erzeugt einen Vektor, sodass jeder Slot die Anzahl der Vorkommen des entsprechenden Werts im Eingabevektor speichert. Jeder Slot in diesem Vektor entspricht einem Wert im Wörterbuch, sodass seine Länge die Größe des integrierten Wörterbuchs ist. Indicator und Bag unterscheiden sich einfach darin, wie die Bitvektoren, die aus einzelnen Steckplätzen in der Eingabespalte generiert werden, aggregiert werden: Für Indikator werden sie verkettet und für Bag hinzugefügt. Wenn die Quellspalte ein Skalar ist, sind die Optionen "Indikator" und "Taschen" identisch.

  • Key erzeugt Schlüssel in einer KeyDataViewType Spalte. Wenn es sich bei der Eingabespalte um einen Vektor handelt, enthält die Ausgabe einen Vektorschlüsseltyp , wobei jeder Vektor dem jeweiligen Slot des Eingabevektors entspricht. Wenn eine Kategorie im integrierten Wörterbuch nicht gefunden wird, wird ihm der Wert Null zugewiesen.

  • Binary erzeugt einen binären codierten Vektor, um die Werte im Wörterbuch darzustellen, die in der Eingabespalte vorhanden sind. Wenn ein Wert in der Eingabespalte im Wörterbuch nicht gefunden wird, ist die Ausgabe der Nullvektor.

Die OneHotEncodingTransformer kann auf eine oder mehrere Spalten angewendet werden, in diesem Fall erstellt und verwendet ein separates Wörterbuch für jede Spalte, auf die sie angewendet wird.

Überprüfen Sie den Abschnitt "Siehe auch", um Links zu Verwendungsbeispielen zu finden.

Methoden

Fit(IDataView)

Züge und gibt einen OneHotHashEncodingTransformer.

GetOutputSchema(SchemaShape)

Gibt das SchemaShape Schema zurück, das vom Transformator erzeugt wird. Wird für die Schemaverteilung und Überprüfung in einer Pipeline verwendet.

Erweiterungsmethoden

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Fügen Sie einen "Zwischenspeicherungsprüfpunkt" an die Schätzkette an. Dadurch wird sichergestellt, dass die nachgelagerten Schätzer anhand zwischengespeicherter Daten trainiert werden. Es ist hilfreich, einen Cache-Prüfpunkt vor Trainern zu haben, die mehrere Datendurchläufe übernehmen.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Wenn sie eine Schätzung erhalten, geben Sie ein Umbruchobjekt zurück, das einen Delegaten aufruft, sobald Fit(IDataView) er aufgerufen wird. Es ist häufig wichtig, dass ein Schätzer Informationen darüber zurückgibt, was passt, weshalb die Fit(IDataView) Methode ein speziell typiertes Objekt zurückgibt, anstatt nur ein allgemeines ITransformerObjekt zurückzugeben. IEstimator<TTransformer> Gleichzeitig werden jedoch häufig Pipelines mit vielen Objekten gebildet, daher müssen wir möglicherweise eine Kette von Schätzern erstellen, über EstimatorChain<TLastTransformer> die der Schätzer, für den wir den Transformator erhalten möchten, irgendwo in dieser Kette begraben wird. Für dieses Szenario können wir über diese Methode eine Stellvertretung anfügen, die aufgerufen wird, sobald sie aufgerufen wird.

Gilt für:

Weitere Informationen