Compartilhar via


Microsoft.MachineLearningServices workspaces/datasets 2020-05-01-preview

Definição de recurso do Bicep

O tipo de recurso workspaces/conjuntos de dados pode ser implantado com operações direcionadas:

Para obter uma lista das propriedades alteradas em cada versão da API, consulte log de alterações.

Formato de recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/datasets, adicione o Bicep a seguir ao modelo.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {}
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Valores de propriedade

workspaces/conjuntos de dados

Nome Descrição Valor
name O nome do recurso

Veja como definir nomes e tipos para recursos filho no Bicep.
cadeia de caracteres (obrigatório)
pai No Bicep, você pode especificar o recurso pai para um recurso filho. Você só precisa adicionar essa propriedade quando o recurso filho é declarado fora do recurso pai.

Para obter mais informações, consulte Recurso filho fora do recurso pai.
Nome simbólico para o recurso do tipo: workspaces
datasetType Especifica o tipo de conjunto de dados. 'file'
'tabular' (obrigatório)
parameters DatasetCreateRequestParameters (obrigatório)
registro DatasetCreateRequestRegistration (obrigatório)
skipValidation Ignore a validação que garante que os dados possam ser carregados do conjunto de dados antes do registro. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nome Descrição Valor
header Tipo de cabeçalho. 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Booliano para manter as informações do caminho como coluna no conjunto de dados. Usa False como padrão. É útil ao ler vários arquivos e quer saber de qual arquivo um registro específico foi originado, ou para manter informações úteis no caminho do arquivo. bool
partitionFormat As informações de partição de cada caminho serão extraídas em colunas com base no formato especificado. A parte do formato '{column_name}' cria uma coluna de cadeia de caracteres e '{column_name:yyyy/MM/dd/HH/mm/ss}' cria a coluna datetime, na qual 'yyyy', 'MM', 'dd', 'HH', 'mm' e 'ss' são usados para extrair ano, mês, dia, hora, minuto e segundos para o tipo datetime. O formato deve começar da posição da primeira chave de partição até o final do caminho do arquivo. Por exemplo, dado o caminho '.. /USA/2019/01/01/data.parquet' em que a partição está por país/região e hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' cria uma coluna de cadeia de caracteres 'CountryOrRegion' com o valor 'USA' e uma coluna datetime 'PartitionDate' com o valor '2019-01-01 string
caminho DatasetCreateRequestParametersPath
Consulta DatasetCreateRequestParametersQuery
separator O separador usado para dividir colunas para sourceType 'delimited_files'. string
sourceType Tipo de fonte de dados. 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

Nome Descrição Valor
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl A URL Http. string

DatasetCreateRequestParametersPathDataPath

Nome Descrição Valor
datastoreName O nome do armazenamento de dados. string
relativePath Caminho dentro do armazenamento de dados. string

DatasetCreateRequestParametersQuery

Nome Descrição Valor
datastoreName O nome do armazenamento de dados SQL/PostgreSQL/MySQL. string
Consulta Consulta SQL. string

DatasetCreateRequestRegistration

Nome Descrição Valor
descrição A descrição do conjunto de dados. string
name O nome do conjunto de dados. string
marcas Marcas associadas ao conjunto de dados. objeto

DatasetCreateRequestTimeSeries

Nome Descrição Valor
coarseGrainTimestamp Nome da coluna a ser usado como CoarseGrainTimestamp. Só poderá ser usado se 'fineGrainTimestamp' for especificado e não puder ser igual a 'fineGrainTimestamp'. string
fineGrainTimestamp Nome da coluna a ser usado como FineGrainTimestamp string

Modelos de início rápido

Os modelos de início rápido a seguir implantam esse tipo de recurso.

Modelo Descrição
Criar conjunto de dados de arquivo do caminho relativo no armazenamento de dados

Implantar no Azure
Esse modelo cria um conjunto de dados de arquivo do caminho relativo no armazenamento de dados no workspace do Azure Machine Learning.
Criar conjunto de dados de arquivo no workspace do AML a partir da URL da Web

Implantar no Azure
Este modelo cria um conjunto de dados de arquivo da URL da Web no workspace do Azure Machine Learning.
Criar conjunto de dados tabular do caminho relativo no armazenamento de dados

Implantar no Azure
Este modelo cria um conjunto de dados tabular do caminho relativo no armazenamento de dados no workspace do Azure Machine Learning.
Criar conjunto de dados tabular do SQL/PostgreSQL/MySQL Datastore

Implantar no Azure
Este modelo cria um conjunto de dados tabular da consulta SQL no armazenamento de dados SQL/PostgreSQL/MySQL no workspace do Azure Machine Learning.
Criar conjunto de dados tabulares no workspace do AML a partir da URL da Web

Implantar no Azure
Este modelo cria um conjunto de dados tabular da URL da Web no workspace do Azure Machine Learning.
Criar workspace do AML com vários conjuntos de dados & Datastores

Implantar no Azure
Este modelo cria o workspace do Azure Machine Learning com vários conjuntos de dados & armazenamentos de dados.

Definição de recurso de modelo do ARM

O tipo de recurso workspaces/conjuntos de dados pode ser implantado com operações direcionadas:

Para obter uma lista das propriedades alteradas em cada versão da API, consulte log de alterações.

Formato de recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/datasets, adicione o JSON a seguir ao modelo.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {}
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Valores de propriedade

workspaces/conjuntos de dados

Nome Descrição Valor
tipo O tipo de recurso 'Microsoft.MachineLearningServices/workspaces/datasets'
apiVersion A versão da API do recurso '2020-05-01-preview'
name O nome do recurso

Veja como definir nomes e tipos para recursos filho em modelos do ARM JSON.
cadeia de caracteres (obrigatório)
datasetType Especifica o tipo de conjunto de dados. 'file'
'tabular' (obrigatório)
parameters DatasetCreateRequestParameters (obrigatório)
registro DatasetCreateRequestRegistration (obrigatório)
skipValidation Ignore a validação que garante que os dados possam ser carregados do conjunto de dados antes do registro. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nome Descrição Valor
header Tipo de cabeçalho. 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Booliano para manter as informações do caminho como coluna no conjunto de dados. Usa False como padrão. É útil ao ler vários arquivos e quer saber de qual arquivo um registro específico foi originado, ou para manter informações úteis no caminho do arquivo. bool
partitionFormat As informações de partição de cada caminho serão extraídas em colunas com base no formato especificado. A parte do formato '{column_name}' cria uma coluna de cadeia de caracteres e '{column_name:yyyy/MM/dd/HH/mm/ss}' cria a coluna datetime, na qual 'yyyy', 'MM', 'dd', 'HH', 'mm' e 'ss' são usados para extrair ano, mês, dia, hora, minuto e segundos para o tipo datetime. O formato deve começar da posição da primeira chave de partição até o final do caminho do arquivo. Por exemplo, dado o caminho '.. /USA/2019/01/01/data.parquet' em que a partição está por país/região e hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' cria uma coluna de cadeia de caracteres 'CountryOrRegion' com o valor 'USA' e uma coluna datetime 'PartitionDate' com o valor '2019-01-01 string
caminho DatasetCreateRequestParametersPath
Consulta DatasetCreateRequestParametersQuery
separator O separador usado para dividir colunas para sourceType 'delimited_files'. string
sourceType Tipo de fonte de dados. 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

Nome Descrição Valor
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl A URL Http. string

DatasetCreateRequestParametersPathDataPath

Nome Descrição Valor
datastoreName O nome do armazenamento de dados. string
relativePath Caminho dentro do armazenamento de dados. string

DatasetCreateRequestParametersQuery

Nome Descrição Valor
datastoreName O nome do armazenamento de dados SQL/PostgreSQL/MySQL. string
Consulta Consulta SQL. string

DatasetCreateRequestRegistration

Nome Descrição Valor
descrição A descrição do conjunto de dados. string
name O nome do conjunto de dados. string
marcas Marcas associadas ao conjunto de dados. objeto

DatasetCreateRequestTimeSeries

Nome Descrição Valor
coarseGrainTimestamp Nome da coluna a ser usado como CoarseGrainTimestamp. Só poderá ser usado se 'fineGrainTimestamp' for especificado e não puder ser igual a 'fineGrainTimestamp'. string
fineGrainTimestamp Nome da coluna a ser usado como FineGrainTimestamp string

Modelos de início rápido

Os modelos de início rápido a seguir implantam esse tipo de recurso.

Modelo Descrição
Criar conjunto de dados de arquivo do caminho relativo no armazenamento de dados

Implantar no Azure
Esse modelo cria um conjunto de dados de arquivo do caminho relativo no armazenamento de dados no workspace do Azure Machine Learning.
Criar conjunto de dados de arquivo no workspace do AML a partir da URL da Web

Implantar no Azure
Este modelo cria um conjunto de dados de arquivo da URL da Web no workspace do Azure Machine Learning.
Criar conjunto de dados tabular do caminho relativo no armazenamento de dados

Implantar no Azure
Este modelo cria um conjunto de dados tabular do caminho relativo no armazenamento de dados no workspace do Azure Machine Learning.
Criar conjunto de dados tabular do SQL/PostgreSQL/MySQL Datastore

Implantar no Azure
Este modelo cria um conjunto de dados tabular da consulta SQL no armazenamento de dados SQL/PostgreSQL/MySQL no workspace do Azure Machine Learning.
Criar conjunto de dados tabulares no workspace do AML a partir da URL da Web

Implantar no Azure
Este modelo cria um conjunto de dados tabular da URL da Web no workspace do Azure Machine Learning.
Criar workspace do AML com vários conjuntos de dados & Datastores

Implantar no Azure
Este modelo cria o workspace do Azure Machine Learning com vários conjuntos de dados & armazenamentos de dados.

Definição de recurso do Terraform (provedor de AzAPI)

O tipo de recurso workspaces/conjuntos de dados pode ser implantado com operações direcionadas:

  • Grupos de recursos

Para obter uma lista das propriedades alteradas em cada versão da API, consulte log de alterações.

Formato de recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/datasets, adicione o Terraform a seguir ao modelo.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {}
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Valores de propriedade

workspaces/conjuntos de dados

Nome Descrição Valor
tipo O tipo de recurso "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name O nome do recurso cadeia de caracteres (obrigatório)
parent_id A ID do recurso que é o pai desse recurso. ID do recurso do tipo: workspaces
datasetType Especifica o tipo de conjunto de dados. "file"
"tabular" (obrigatório)
parameters DatasetCreateRequestParameters (obrigatório)
registro DatasetCreateRequestRegistration (obrigatório)
skipValidation Ignore a validação que garante que os dados possam ser carregados do conjunto de dados antes do registro. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nome Descrição Valor
header Tipo de cabeçalho. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Booliano para manter as informações do caminho como coluna no conjunto de dados. Usa False como padrão. É útil ao ler vários arquivos e quer saber de qual arquivo um registro específico foi originado, ou para manter informações úteis no caminho do arquivo. bool
partitionFormat As informações de partição de cada caminho serão extraídas em colunas com base no formato especificado. A parte do formato '{column_name}' cria uma coluna de cadeia de caracteres e '{column_name:yyyy/MM/dd/HH/mm/ss}' cria a coluna datetime, na qual 'yyyy', 'MM', 'dd', 'HH', 'mm' e 'ss' são usados para extrair ano, mês, dia, hora, minuto e segundos para o tipo datetime. O formato deve começar da posição da primeira chave de partição até o final do caminho do arquivo. Por exemplo, dado o caminho '.. /USA/2019/01/01/data.parquet' onde a partição é por país/região e hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' cria uma coluna de cadeia de caracteres 'CountryOrRegion' com o valor 'USA' e uma coluna datetime 'PartitionDate' com o valor '2019-01-01 string
caminho DatasetCreateRequestParametersPath
Consulta DatasetCreateRequestParametersQuery
separator O separador usado para dividir colunas para sourceType 'delimited_files'. string
sourceType Tipo de fonte de dados. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Nome Descrição Valor
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl A URL http. string

DatasetCreateRequestParametersPathDataPath

Nome Descrição Valor
datastoreName O nome do armazenamento de dados. string
relativePath Caminho no armazenamento de dados. string

DatasetCreateRequestParametersQuery

Nome Descrição Valor
datastoreName O nome do armazenamento de dados SQL/PostgreSQL/MySQL. string
Consulta SQL Quey. string

DatasetCreateRequestRegistration

Nome Descrição Valor
descrição A descrição do conjunto de dados. string
name O nome do conjunto de dados. string
marcas Marcas associadas ao conjunto de dados. objeto

DatasetCreateRequestTimeSeries

Nome Descrição Valor
coarseGrainTimestamp Nome da coluna a ser usado como CoarseGrainTimestamp. Só poderá ser usado se 'fineGrainTimestamp' for especificado e não puder ser igual a 'fineGrainTimestamp'. string
fineGrainTimestamp Nome da coluna a ser usado como FineGrainTimestamp string