Freigeben über


Microsoft.MachineLearningServices-Arbeitsbereiche/Datasets 2020-05-01-preview

Bicep-Ressourcendefinition

Der Ressourcentyp Arbeitsbereiche/Datasets kann mit Vorgängen bereitgestellt werden, die Folgendes zum Ziel haben:

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie der Vorlage den folgenden Bicep hinzu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {}
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Eigenschaftswerte

Arbeitsbereiche/Datasets

Name BESCHREIBUNG Wert
name Der Ressourcenname

Erfahren Sie, wie Sie Namen und Typen für untergeordnete Ressourcen in Bicep festlegen.
Zeichenfolge (erforderlich)
parent In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird.

Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource.
Symbolischer Name für Ressource vom Typ: Arbeitsbereiche
datasetType Gibt den Datasettyp an. 'Datei'
"tabellarisch" (erforderlich)
parameters DatasetCreateRequestParameters (erforderlich)
Registrierung DatasetCreateRequestRegistration (erforderlich)
skipValidation Überspringen Sie die Überprüfung, um sicherzustellen, dass Daten vor der Registrierung aus dem Dataset geladen werden können. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Name BESCHREIBUNG Wert
header Headertyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Ein boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Der Standardwert lautet „False“. Dies ist hilfreich, wenn Sie mehrere Dateien lesen und wissen möchten, aus welcher Datei ein bestimmter Datensatz stammt. Außerdem können Sie damit nützliche Informationen im Dateipfad speichern. bool
partitionFormat Die Partitionsinformationen für die einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Mit dem Formatteil „{column_name}“ wird eine Zeichenfolgenspalte erstellt, und „{column_name:yyyyyy/MM/dd/HH/mm/ss}“ erstellt eine datetime-Spalte, wobei „yyyy“, „MM“, „dd“, „HH“, „mm“ und „ss“ verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den datetime-Typ zu extrahieren. Das Format muss an der Position des ersten Partitionsschlüssels beginnen und bis zum Ende des Dateipfads reichen. Beispiel: Aufgrund des Pfads ".. /USA/2019/01/data.parquet", wobei die Partition nach Land/Region und Uhrzeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv" erstellt eine Zeichenfolgenspalte "CountryOrRegion" mit dem Wert "USA" und eine datetime-Spalte "PartitionDate" mit dem Wert "2019-01-01-01". Zeichenfolge
path DatasetCreateRequestParametersPath
Abfrage DatasetCreateRequestParametersQuery
Trennzeichen Das Trennzeichen, das zum Aufteilen von Spalten für "delimited_files" sourceType verwendet wird. Zeichenfolge
sourceType Datenquellentyp. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Name BESCHREIBUNG Wert
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Die HTTP-URL. Zeichenfolge

DatasetCreateRequestParametersPathDataPath

Name BESCHREIBUNG Wert
datastoreName Der Datenspeichername Zeichenfolge
relativePath Pfad innerhalb des Datenspeichers. Zeichenfolge

DatasetCreateRequestParametersQuery

Name BESCHREIBUNG Wert
datastoreName Der Name des SQL/PostgreSQL/MySQL-Datenspeichers. Zeichenfolge
Abfrage SQL Quey. Zeichenfolge

DatasetCreateRequestRegistration

Name BESCHREIBUNG Wert
description Die Beschreibung für das Dataset. Zeichenfolge
name Der Name des Datasets. Zeichenfolge
tags Dem Dataset zugeordnete Tags. Objekt (object)

DatasetCreateRequestTimeSeries

Name BESCHREIBUNG Wert
coarseGrainTimestamp Spaltenname, der als CoarseGrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn "fineGrainTimestamp" angegeben ist und nicht mit "fineGrainTimestamp" identisch sein kann. Zeichenfolge
fineGrainTimestamp Spaltenname, der als FineGrainTimestamp verwendet werden soll Zeichenfolge

Schnellstartvorlagen

In den folgenden Schnellstartvorlagen wird dieser Ressourcentyp bereitgestellt.

Vorlage BESCHREIBUNG
Erstellen eines Dateidatasets aus dem relativen Pfad im Datenspeicher

Bereitstellen in Azure
Diese Vorlage erstellt ein Dateidataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines Dateidatasets im AML-Arbeitsbereich über die Web-URL

Bereitstellen in Azure
Mit dieser Vorlage wird ein Dateidataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich erstellt.
Erstellen eines tabellarischen Datasets aus dem relativen Pfad im Datenspeicher

Bereitstellen in Azure
Diese Vorlage erstellt ein tabellarisches Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets aus dem SQL-/PostgreSQL-/MySQL-Datenspeicher

Bereitstellen in Azure
Diese Vorlage erstellt ein tabellarisches Dataset aus SQL-Abfrage im SQL-/PostgreSQL-/MySQL-Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets im AML-Arbeitsbereich über die Web-URL

Bereitstellen in Azure
Diese Vorlage erstellt ein tabellarisches Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich.
Erstellen eines AML-Arbeitsbereichs mit mehreren Datasets & Datenspeichern

Bereitstellen in Azure
Diese Vorlage erstellt einen Azure Machine Learning-Arbeitsbereich mit mehreren Datasets & Datenspeichern.

Ressourcendefinition mit einer ARM-Vorlage

Der Ressourcentyp workspaces/datasets kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie im Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie der Vorlage den folgenden JSON-Code hinzu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {}
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Eigenschaftswerte

Arbeitsbereiche/Datasets

Name BESCHREIBUNG Wert
type Der Ressourcentyp "Microsoft.MachineLearningServices/workspaces/datasets"
apiVersion Die Version der Ressourcen-API "2020-05-01-preview"
name Der Ressourcenname

Weitere Informationen finden Sie unter Festlegen von Namen und Typen für untergeordnete Ressourcen in JSON-ARM-Vorlagen.
Zeichenfolge (erforderlich)
datasetType Gibt den Datasettyp an. "Datei"
"tabellarisch" (erforderlich)
parameters DatasetCreateRequestParameters (erforderlich)
Registrierung DatasetCreateRequestRegistration (erforderlich)
skipValidation Überspringen Sie die Überprüfung, die sicherstellt, dass Daten vor der Registrierung aus dem Dataset geladen werden können. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Name BESCHREIBUNG Wert
header Headertyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Ein boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Der Standardwert lautet „False“. Dies ist hilfreich, wenn Sie mehrere Dateien lesen und wissen möchten, aus welcher Datei ein bestimmter Datensatz stammt. Außerdem können Sie damit nützliche Informationen im Dateipfad speichern. bool
partitionFormat Die Partitionsinformationen für die einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Mit dem Formatteil „{column_name}“ wird eine Zeichenfolgenspalte erstellt, und „{column_name:yyyyyy/MM/dd/HH/mm/ss}“ erstellt eine datetime-Spalte, wobei „yyyy“, „MM“, „dd“, „HH“, „mm“ und „ss“ verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den datetime-Typ zu extrahieren. Das Format muss an der Position des ersten Partitionsschlüssels beginnen und bis zum Ende des Dateipfads reichen. Beispiel: Unter Berücksichtigung des Pfads ".. /USA/2019/01/01/data.parquet", wobei die Partition nach Land/Region und Uhrzeit partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/tt}/data.csv" eine Zeichenfolgenspalte "CountryOrRegion" mit dem Wert "USA" und eine datetime-Spalte "PartitionDate" mit dem Wert "2019-01-01" erstellt. Zeichenfolge
path DatasetCreateRequestParametersPath
Abfrage DatasetCreateRequestParametersQuery
Trennzeichen Das Trennzeichen, das zum Aufteilen von Spalten für "delimited_files" sourceType verwendet wird. Zeichenfolge
sourceType Datenquellentyp. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Name BESCHREIBUNG Wert
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Die HTTP-URL. Zeichenfolge

DatasetCreateRequestParametersPathDataPath

Name BESCHREIBUNG Wert
datastoreName Der Datenspeichername Zeichenfolge
relativePath Pfad innerhalb des Datenspeichers. Zeichenfolge

DatasetCreateRequestParametersQuery

Name BESCHREIBUNG Wert
datastoreName Der Name des SQL-/PostgreSQL-/MySQL-Datenspeichers. Zeichenfolge
Abfrage SQL Quey. Zeichenfolge

DatasetCreateRequestRegistration

Name BESCHREIBUNG Wert
description Die Beschreibung für das Dataset. Zeichenfolge
name Der Name des Datasets. Zeichenfolge
tags Dem Dataset zugeordnete Tags. Objekt (object)

DatasetCreateRequestTimeSeries

Name BESCHREIBUNG Wert
coarseGrainTimestamp Spaltenname, der als CoarseGrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn "fineGrainTimestamp" angegeben ist und nicht mit "fineGrainTimestamp" identisch sein kann. Zeichenfolge
fineGrainTimestamp Spaltenname, der als FineGrainTimestamp verwendet werden soll Zeichenfolge

Schnellstartvorlagen

In den folgenden Schnellstartvorlagen wird dieser Ressourcentyp bereitgestellt.

Vorlage BESCHREIBUNG
Erstellen eines Dateidatasets aus dem relativen Pfad im Datenspeicher

Bereitstellen in Azure
Diese Vorlage erstellt ein Dateidataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines Dateidatasets im AML-Arbeitsbereich über die Web-URL

Bereitstellen in Azure
Mit dieser Vorlage wird ein Dateidataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich erstellt.
Erstellen eines tabellarischen Datasets aus dem relativen Pfad im Datenspeicher

Bereitstellen in Azure
Diese Vorlage erstellt ein tabellarisches Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets aus dem SQL-/PostgreSQL-/MySQL-Datenspeicher

Bereitstellen in Azure
Diese Vorlage erstellt ein tabellarisches Dataset aus SQL-Abfrage im SQL-/PostgreSQL-/MySQL-Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets im AML-Arbeitsbereich über die Web-URL

Bereitstellen in Azure
Diese Vorlage erstellt ein tabellarisches Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich.
Erstellen eines AML-Arbeitsbereichs mit mehreren Datasets & Datenspeichern

Bereitstellen in Azure
Diese Vorlage erstellt einen Azure Machine Learning-Arbeitsbereich mit mehreren Datasets & Datenspeichern.

Terraform-Ressourcendefinition (AzAPI-Anbieter)

Der Ressourcentyp workspaces/datasets kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

  • Ressourcengruppen

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie im Änderungsprotokoll.

Ressourcenformat

Um eine Ressource "Microsoft.MachineLearningServices/workspaces/datasets" zu erstellen, fügen Sie der Vorlage die folgende Terraform-Ressource hinzu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {}
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Eigenschaftswerte

Arbeitsbereiche/Datasets

Name BESCHREIBUNG Wert
type Der Ressourcentyp "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name Der Ressourcenname Zeichenfolge (erforderlich)
parent_id Die ID der Ressource, die das übergeordnete Element für diese Ressource ist. ID für Ressource vom Typ: Arbeitsbereiche
datasetType Gibt den Datasettyp an. "File"
"tabellarisch" (erforderlich)
parameters DatasetCreateRequestParameters (erforderlich)
Registrierung DatasetCreateRequestRegistration (erforderlich)
skipValidation Überspringen Sie die Überprüfung, die sicherstellt, dass Daten vor der Registrierung aus dem Dataset geladen werden können. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Name BESCHREIBUNG Wert
header Headertyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Ein boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Der Standardwert lautet „False“. Dies ist hilfreich, wenn Sie mehrere Dateien lesen und wissen möchten, aus welcher Datei ein bestimmter Datensatz stammt. Außerdem können Sie damit nützliche Informationen im Dateipfad speichern. bool
partitionFormat Die Partitionsinformationen für die einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Mit dem Formatteil „{column_name}“ wird eine Zeichenfolgenspalte erstellt, und „{column_name:yyyyyy/MM/dd/HH/mm/ss}“ erstellt eine datetime-Spalte, wobei „yyyy“, „MM“, „dd“, „HH“, „mm“ und „ss“ verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den datetime-Typ zu extrahieren. Das Format muss an der Position des ersten Partitionsschlüssels beginnen und bis zum Ende des Dateipfads reichen. Beispiel: Unter Berücksichtigung des Pfads ".. /USA/2019/01/01/data.parquet", wobei die Partition nach Land/Region und Uhrzeit partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/tt}/data.csv" eine Zeichenfolgenspalte "CountryOrRegion" mit dem Wert "USA" und eine datetime-Spalte "PartitionDate" mit dem Wert "2019-01-01" erstellt. Zeichenfolge
path DatasetCreateRequestParametersPath
Abfrage DatasetCreateRequestParametersQuery
Trennzeichen Das Trennzeichen, das zum Aufteilen von Spalten für "delimited_files" sourceType verwendet wird. Zeichenfolge
sourceType Datenquellentyp. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Name BESCHREIBUNG Wert
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Die HTTP-URL. Zeichenfolge

DatasetCreateRequestParametersPathDataPath

Name BESCHREIBUNG Wert
datastoreName Der Datenspeichername Zeichenfolge
relativePath Pfad innerhalb des Datenspeichers. Zeichenfolge

DatasetCreateRequestParametersQuery

Name BESCHREIBUNG Wert
datastoreName Der Name des SQL-/PostgreSQL-/MySQL-Datenspeichers. Zeichenfolge
Abfrage SQL Quey. Zeichenfolge

DatasetCreateRequestRegistration

Name BESCHREIBUNG Wert
description Die Beschreibung für das Dataset. Zeichenfolge
name Der Name des Datasets. Zeichenfolge
tags Dem Dataset zugeordnete Tags. Objekt (object)

DatasetCreateRequestTimeSeries

Name BESCHREIBUNG Wert
coarseGrainTimestamp Spaltenname, der als CoarseGrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn "fineGrainTimestamp" angegeben ist und nicht mit "fineGrainTimestamp" identisch sein kann. Zeichenfolge
fineGrainTimestamp Spaltenname, der als FineGrainTimestamp verwendet werden soll Zeichenfolge