CountFeatureSelectingEstimator Classe
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Sélectionne les emplacements pour lesquels le nombre de valeurs autres que des valeurs par défaut est supérieur ou égal à un seuil.
public sealed class CountFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type CountFeatureSelectingEstimator = class
interface IEstimator<ITransformer>
Public NotInheritable Class CountFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
- Héritage
-
CountFeatureSelectingEstimator
- Implémente
Remarques
Caractéristiques de l’estimateur
Cet estimateur doit-il examiner les données pour entraîner ses paramètres ? | Oui |
Type de données de colonne d’entrée | Vecteur ou scalaire des types de SingleDouble données texte ou textuels |
Type de données de colonne de sortie | Identique à la colonne d’entrée |
Exportable vers ONNX | Oui |
Cette transformation utilise un ensemble d’agrégateurs pour compter le nombre de valeurs pour chaque emplacement (élément vectoriel) qui ne sont pas par défaut et non manquants (pour les définitions de valeurs par défaut et manquantes, reportez-vous à la section remarques dans DataKind). Si la valeur du nombre est inférieure au paramètre de nombre fourni, cet emplacement est supprimé. Cette transformation est utile lorsqu’elle est appliquée avec un OneHotHashEncodingTransformer. Elle peut supprimer les fonctionnalités générées par la transformation de hachage qui n’ont pas de données dans les exemples.
Par exemple, si nous définissons le paramètre count sur 3 et que vous ajustez l’estimateur, appliquez le transformateur à la colonne Caractéristiques suivante, nous voyons le deuxième emplacement contenant : NaN (valeur manquante), 5, 5, 0 (valeur par défaut) supprimées, car cet emplacement n’a que deux valeurs non par défaut et non manquantes, c’est-à-dire les deux 5 valeurs. Le troisième emplacement est conservé, car il a les valeurs 6, 6, 6, NaN; il a donc 3 valeurs non par défaut et non manquantes.
Fonctionnalités |
---|
4,NaN,6 |
4,5,6 |
4,5,6 |
4,0,NaN |
Il s’agit de la façon dont le jeu de données ci-dessus se présente après la transformation.
Fonctionnalités |
---|
4,6 |
4,6 |
4,6 |
4,NaN |
Consultez la section Voir aussi pour obtenir des liens vers des exemples d’utilisation.
Méthodes
Fit(IDataView) |
Effectue l’apprentissage et retourne un ITransformer. |
GetOutputSchema(SchemaShape) |
Retourne le SchemaShape schéma qui sera produit par le transformateur. Utilisé pour la propagation et la vérification du schéma dans un pipeline. |
Méthodes d’extension
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Ajoutez un « point de contrôle de mise en cache » à la chaîne d’estimateur. Cela garantit que les estimateurs en aval seront entraînés par rapport aux données mises en cache. Il est utile d’avoir un point de contrôle de mise en cache avant les formateurs qui prennent plusieurs passes de données. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Étant donné un estimateur, retournez un objet de création de package de restrictions qui appellera un délégué une fois Fit(IDataView) appelé. Il est souvent important qu’un estimateur retourne des informations sur ce qui était adapté, c’est pourquoi la Fit(IDataView) méthode retourne un objet spécifiquement typé, plutôt que simplement un général ITransformer. Toutefois, en même temps, IEstimator<TTransformer> sont souvent formés en pipelines avec de nombreux objets. Nous pouvons donc avoir besoin de créer une chaîne d’estimateurs par EstimatorChain<TLastTransformer> le biais de laquelle l’estimateur pour lequel nous voulons obtenir le transformateur est enterré quelque part dans cette chaîne. Pour ce scénario, nous pouvons par le biais de cette méthode attacher un délégué qui sera appelé une fois l’ajustement appelé. |