dataset_utilities Modul

Hilfsmethoden für die Interaktion mit „azureml.core.Dataset“.

Functions

collect_usage_telemetry

collect_usage_telemetry(compute: Any, spark_context: Any, **kwargs: Any) -> None

Parameter

Name Beschreibung
compute
Erforderlich
spark_context
Erforderlich

convert_inputs

Konvertieren der angegebenen Datasets in nachverfolgbare Definitionen.

convert_inputs(X: Any, y: Any, sample_weight: Any, X_valid: Any, y_valid: Any, sample_weight_valid: Any) -> Tuple[Any, Any, Any, Any, Any, Any]

Parameter

Name Beschreibung
X
Erforderlich

Dataset, das X darstellt

y
Erforderlich

Dataset, das y darstellt

sample_weight
Erforderlich

Dataset, das die Stichprobengewichtung darstellt

X_valid
Erforderlich

Dataset, das „X_valid“ darstellt

y_valid
Erforderlich

Dataset, das „y_valid“ darstellt

sample_weight_valid
Erforderlich

Dataset, das die Gewichtung der Überprüfungsstichprobe darstellt

convert_inputs_dataset

Konvertieren der angegebenen Datasets in nachverfolgbare Definitionen.

convert_inputs_dataset(*datasets: Any) -> Tuple[Any, ...]

Parameter

Name Beschreibung
datasets
Erforderlich

Datasets, die in nachverfolgbare Definitionen konvertiert werden sollen

ensure_saved

ensure_saved(workspace: Workspace, **kwargs: Any) -> None

Parameter

Name Beschreibung
workspace
Erforderlich

get_dataset_from_mltable_data_json

Abrufen des Datasets aus dem MLTable-Daten-JSON-Objekt

get_dataset_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_label: MLTableDataLabel) -> AbstractDataset | None

Parameter

Name Beschreibung
ws
Erforderlich

Arbeitsbereich, aus dem das Datasets abgerufen werden soll

mltable_data_json_obj
Erforderlich

JSON-Objekt mit MLTable-Daten

data_label
Erforderlich

Bezeichnung, die das aus dem MLTable-Daten-JSON-Objekt zu ladende Dataset angibt

get_datasets_from_data_json

Abrufen von Datasets aus dem Daten-JSON-Objekt, bei dem es sich um ein MLTable-Daten-JSON-Objekt (mit URI) oder ein Dataprep-JSON-Objekt (mit Dataset-ID) handeln kann

get_datasets_from_data_json(ws: Workspace, data_preparation_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parameter

Name Beschreibung
ws
Erforderlich

Arbeitsbereich, aus dem das Datasets abgerufen werden soll

data_preparation_json
Erforderlich

Daten-JSON-Objekt

data_labels
Erforderlich

Liste der Bezeichnungen, die das Dataset angeben, das aus dem Daten-JSON-Objekt geladen werden soll

get_datasets_from_dataprep_json

Abrufen des Datasets aus dem Dataprep-JSON-Objekt (mit Dataset-ID)

get_datasets_from_dataprep_json(ws: Workspace, dataprep_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parameter

Name Beschreibung
ws
Erforderlich

Arbeitsbereich, aus dem das Datasets abgerufen werden soll

data_preparation_json
Erforderlich

Daten-JSON-Objekt

data_labels
Erforderlich

Liste der Bezeichnungen, die das Dataset angeben, das aus dem Daten-JSON-Objekt geladen werden soll

dataprep_json
Erforderlich

get_datasets_from_mltable_data_json

Abrufen von Datasets aus MLTable-Daten-JSON-Objekt (mit URI)

get_datasets_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parameter

Name Beschreibung
ws
Erforderlich

Arbeitsbereich, aus dem das Datasets abgerufen werden soll

data_preparation_json
Erforderlich

Daten-JSON-Objekt

data_labels
Erforderlich

Liste der Bezeichnungen, die das Dataset angeben, das aus dem Daten-JSON-Objekt geladen werden soll

mltable_data_json_obj
Erforderlich

get_datasets_json

Ruft den dataprep-JSON-Code ab.

get_datasets_json(training_data: Any | None = None, validation_data: Any | None = None, test_data: Any | None = None) -> str | None

Parameter

Name Beschreibung
training_data

Trainingsdaten

Standardwert: None
validation_data

Validierungsdaten

Standardwert: None
test_data

Testdaten

Standardwert: None

Gibt zurück

Typ Beschreibung

JSON-Zeichenfolgendarstellung eines Dataset-Wörterbuchs

is_dataset

Überprüfen, ob das angegebene Objekt ein Dataset oder eine Datasetdefinition ist.

is_dataset(dataset: Any) -> bool

Parameter

Name Beschreibung
dataset
Erforderlich

Zu überprüfendes Objekt