DataReference Classe

Referência

Representa uma referência a dados em um armazenamento de dados.

Uma DataReference representa um caminho em um armazenamento de dados e pode ser usada para descrever como e onde os dados devem ser disponibilizados em uma execução. Essa não é mais a abordagem recomendada para acesso e entrega de dados no Azure Machine Learning. O conjunto de dados dá suporte ao acesso de dados de Armazenamento de Blobs do Azure, Arquivos do Azure, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Banco de Dados SQL do Azure e Banco de Dados do Azure para PostgreSQL por meio de interface unificada com recursos de gerenciamento de dados adicionados. É recomendável usar o conjunto de dados para ler dados em seus projetos de machine learning.

Para obter mais informações sobre como usar o conjunto de dados do Azure ML em dois cenários comuns, consulte os artigos:

Construtor DataReference de classe.

Herança: builtins.object

DataReference

Construtor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parâmetros

Nome	Description
datastore Obrigatório	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] O armazenamento de dados para referenciar.
data_reference_name	str O nome da referência de dados. Valor padrão: None
path_on_datastore	str O caminho relativo no armazenamento de suporte para referência de dados. Valor padrão: None
mode	str A operação na referência de dados. Os valores compatíveis são 'mount' (o padrão) e 'download'. Use o modo 'download' quando o script espera um caminho específico (por exemplo, embutido em código) para os dados de entrada. Nesse caso, especifique o caminho com o parâmetro `path_on_compute` ao declarar a DataReference. O Azure Machine Learning baixará os dados especificados por esse caminho antes de executar seu script. Com o modo 'mount', um diretório temporário é criado com os dados montados e uma variável de ambiente $AZUREML _DATAREFERENCE_ <data_reference_name> é definido com o caminho para o diretório temporário. Se você passar um DataReference para a lista de argumentos de uma etapa do pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local em runtime. Valor padrão: mount
path_on_compute	str O caminho no destino de computação para a referência de dados. Valor padrão: None
overwrite	bool Indica se os dados existentes devem ser substituídos. Valor padrão: False
datastore Obrigatório	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] O armazenamento de dados para referenciar.
data_reference_name Obrigatório	str O nome da referência de dados.
path_on_datastore Obrigatório	str O caminho relativo no armazenamento de suporte para referência de dados.
mode Obrigatório	str A operação na referência de dados. Valores com suporte 'mount' (o padrão) e 'download'. Use o modo 'download' quando o script espera um caminho específico (por exemplo, embutido em código) para os dados de entrada. Nesse caso, especifique o caminho com o parâmetro `path_on_compute` ao declarar a DataReference. O Azure Machine Learning baixará os dados especificados por esse caminho antes de executar seu script. Com o modo 'mount', um diretório temporário é criado com os dados montados e uma variável de ambiente $AZUREML _DATAREFERENCE_ <data_reference_name> é definido com o caminho para o diretório temporário. Se você passar um DataReference para a lista de argumentos de uma etapa do pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local em runtime.
path_on_compute Obrigatório	str O caminho no destino de computação para a referência de dados.
overwrite Obrigatório	bool Indica se os dados existentes devem ser substituídos.

Comentários

Um DataReference define o local dos dados e como os dados são usados na associação de computação de destino (montagem ou upload). O caminho para os dados no armazenamento de dados pode ser a raiz /, um diretório dentro do armazenamento de dados ou um arquivo no armazenamento de dados.

Métodos

as_download	Alterna a operação de referência de dados para download. O download de DataReference dá suporte apenas ao Blob do Azure e ao Compartilhamento de Arquivos do Azure. Para baixar dados do Azure Blob, Azure File Share, Azure Data Lake Gen1 e Azure Data Lake Gen2, recomendamos usar o conjunto de dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, acesse https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_mount	Alterna a operação de referência de dados para montar. A montagem DataReference só é compatível com o Azure Blob. Para montar dados no Azure Blob, Azure File Share, Azure Data Lake Gen1 e Azure Data Lake Gen2, recomendamos usar o conjunto de dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, acesse https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_upload	Alterna a operação de referência de dados para carregar. Para obter mais informações sobre quais computações e armazenamentos de dados são compatíveis com o carregamento de dados, consulte: https://aka.ms/datastore-matrix.
create	Cria um DataReference usando DataPath e DataPathComputeBinding.
path	Cria uma instância de DataReference com base no caminho fornecido.
to_config	Converte o objeto DataReference no objeto DataReferenceConfiguration.

as_download

Alterna a operação de referência de dados para download.

O download de DataReference dá suporte apenas ao Blob do Azure e ao Compartilhamento de Arquivos do Azure. Para baixar dados do Azure Blob, Azure File Share, Azure Data Lake Gen1 e Azure Data Lake Gen2, recomendamos usar o conjunto de dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, acesse https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parâmetros

Nome	Description
path_on_compute	str O caminho na computação para a referência de dados. Valor padrão: None
overwrite	bool Indica se os dados existentes devem ser substituídos. Valor padrão: False

Retornos

Tipo	Description
DataReference	Um novo objeto de referência de dados.

as_mount

Alterna a operação de referência de dados para montar.

A montagem DataReference só é compatível com o Azure Blob. Para montar dados no Azure Blob, Azure File Share, Azure Data Lake Gen1 e Azure Data Lake Gen2, recomendamos usar o conjunto de dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, acesse https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Retornos

Tipo	Description
DataReference	Um novo objeto de referência de dados.

as_upload

Alterna a operação de referência de dados para carregar.

Para obter mais informações sobre quais computações e armazenamentos de dados são compatíveis com o carregamento de dados, consulte: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parâmetros

Nome	Description
path_on_compute	str O caminho na computação para a referência de dados. Valor padrão: None
overwrite	bool Indica se os dados existentes devem ser substituídos. Valor padrão: False

Retornos

Tipo	Description
DataReference	Um novo objeto de referência de dados.

create

Cria um DataReference usando DataPath e DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parâmetros

Nome	Description
data_reference_name	str O nome da referência de dados a ser criada. Valor padrão: None
datapath	DataPath [Obrigatório] O caminho de dados a ser usado. Valor padrão: None
datapath_compute_binding	DataPathComputeBinding [Obrigatório] A associação de computação do caminho de dados a ser usada. Valor padrão: None

Retornos

Tipo	Description
DataReference	Um objeto DataReference.

path

Cria uma instância de DataReference com base no caminho fornecido.

path(path=None, data_reference_name=None)

Parâmetros

Nome	Description
path	str O caminho no armazenamento de dados. Valor padrão: None
data_reference_name	str O nome da referência de dados. Valor padrão: None

Retornos

Tipo	Description
DataReference	O objeto de referência de dados.

to_config

Converte o objeto DataReference no objeto DataReferenceConfiguration.

to_config()

Retornos

Tipo	Description
DataReferenceConfiguration	Um novo objeto DataReferenceConfiguration.

Compartilhar via

DataReference Classe

Construtor

Parâmetros

Comentários

Métodos

as_download

Parâmetros

Retornos

as_mount

Retornos

as_upload

Parâmetros

Retornos

create

Parâmetros

Retornos

path

Parâmetros

Retornos

to_config

Retornos

Comentários

Recursos adicionais