Partilhar via


DataReference Classe

Representa uma referência aos dados num arquivo de dados.

Uma DataReference representa um caminho num arquivo de dados e pode ser utilizada para descrever como e onde os dados devem ser disponibilizados numa execução. Já não é a abordagem recomendada para o acesso e entrega de dados no Azure Machine Learning. O conjunto de dados suporta o acesso a dados a partir do armazenamento de Blobs do Azure, Ficheiros do Azure, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, base de dados SQL do Azure e Base de Dados do Azure para PostgreSQL através da interface unificada com capacidades de gestão de dados adicionadas. Recomenda-se que utilize o conjunto de dados para ler dados nos seus projetos de machine learning.

Para obter mais informações sobre como utilizar o conjunto de dados do Azure ML em dois cenários comuns, veja os artigos:

Construtor de Classe DataReference.

Herança
builtins.object
DataReference

Construtor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parâmetros

Name Description
datastore
Necessário

O arquivo de dados a referenciar.

data_reference_name
str

O nome da referência de dados.

Default value: None
path_on_datastore
str

O caminho relativo no armazenamento de cópia de segurança da referência de dados.

Default value: None
mode
str

A operação na referência de dados. Os valores suportados são "montar" (a predefinição) e "transferir".

Utilize o modo de "transferência" quando o script espera um caminho específico (por exemplo, codificado) para os dados de entrada. Neste caso, especifique o caminho com o path_on_compute parâmetro quando declarar a DataReference. O Azure Machine Learning irá transferir os dados especificados por esse caminho antes de executar o script.

Com o modo de "montagem", é criado um diretório temporário com os dados montados e uma variável de ambiente $AZUREML_DATAREFERENCE_<data_reference_name> é definido com o caminho para o diretório temporário. Se transmitir uma DataReference para a lista de argumentos de um passo de pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local no runtime.

Default value: mount
path_on_compute
str

O caminho no destino de computação para a referência de dados.

Default value: None
overwrite

Indica se deve substituir os dados existentes.

Default value: False
datastore
Necessário

O arquivo de dados a referenciar.

data_reference_name
Necessário
str

O nome da referência de dados.

path_on_datastore
Necessário
str

O caminho relativo no armazenamento de cópia de segurança da referência de dados.

mode
Necessário
str

A operação na referência de dados. Valores suportados "montar" (a predefinição) e "download".

Utilize o modo de "transferência" quando o script espera um caminho específico (por exemplo, codificado) para os dados de entrada. Neste caso, especifique o caminho com o path_on_compute parâmetro quando declarar a DataReference. O Azure Machine Learning irá transferir os dados especificados por esse caminho antes de executar o script.

Com o modo de "montagem", é criado um diretório temporário com os dados montados e uma variável de ambiente $AZUREML_DATAREFERENCE_<data_reference_name> é definido com o caminho para o diretório temporário. Se transmitir uma DataReference para a lista de argumentos de um passo de pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local no runtime.

path_on_compute
Necessário
str

O caminho no destino de computação para a referência de dados.

overwrite
Necessário

Indica se deve substituir os dados existentes.

Observações

Uma DataReference define a localização dos dados e a forma como os dados são utilizados no enlace de computação de destino (montagem ou carregamento). O caminho para os dados no arquivo de dados pode ser a raiz /, um diretório no arquivo de dados ou um ficheiro no arquivo de dados.

Métodos

as_download

Mude a operação de referência de dados para transferir.

A transferência de DataReference só suporta o Blob do Azure e a Partilha de Ficheiros do Azure. Para transferir dados do Blob do Azure, da Partilha de Ficheiros do Azure, do Azure Data Lake Gen1 e do Azure Data Lake Gen2, recomendamos que utilize o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Mudar a operação de referência de dados para montagem.

A montagem DataReference só suporta o Blob do Azure. Para montar dados no Blob do Azure, na Partilha de Ficheiros do Azure, no Azure Data Lake Gen1 e no Azure Data Lake Gen2, recomendamos a utilização do Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Mude a operação de referência de dados para carregar.

Para obter mais informações sobre que computação e arquivos de dados suportam o carregamento dos dados, consulte: https://aka.ms/datastore-matrix.

create

Create uma DataReference com DataPath e DataPathComputeBinding.

path

Create uma instância dataReference com base no caminho especificado.

to_config

Converta o objeto DataReference para o objeto DataReferenceConfiguration.

as_download

Mude a operação de referência de dados para transferir.

A transferência de DataReference só suporta o Blob do Azure e a Partilha de Ficheiros do Azure. Para transferir dados do Blob do Azure, da Partilha de Ficheiros do Azure, do Azure Data Lake Gen1 e do Azure Data Lake Gen2, recomendamos que utilize o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parâmetros

Name Description
path_on_compute
str

O caminho na computação para a referência de dados.

Default value: None
overwrite

Indica se deve substituir os dados existentes.

Default value: False

Devoluções

Tipo Description

Um novo objeto de referência de dados.

as_mount

Mudar a operação de referência de dados para montagem.

A montagem DataReference só suporta o Blob do Azure. Para montar dados no Blob do Azure, na Partilha de Ficheiros do Azure, no Azure Data Lake Gen1 e no Azure Data Lake Gen2, recomendamos a utilização do Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Devoluções

Tipo Description

Um novo objeto de referência de dados.

as_upload

Mude a operação de referência de dados para carregar.

Para obter mais informações sobre que computação e arquivos de dados suportam o carregamento dos dados, consulte: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parâmetros

Name Description
path_on_compute
str

O caminho na computação para a referência de dados.

Default value: None
overwrite

Indica se deve substituir os dados existentes.

Default value: False

Devoluções

Tipo Description

Um novo objeto de referência de dados.

create

Create uma DataReference com DataPath e DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parâmetros

Name Description
data_reference_name
str

O nome da referência de dados a criar.

Default value: None
datapath

[Obrigatório] O caminho de dados a utilizar.

Default value: None
datapath_compute_binding

[Obrigatório] O enlace de computação do datapath a utilizar.

Default value: None

Devoluções

Tipo Description

Um objeto DataReference.

path

Create uma instância dataReference com base no caminho especificado.

path(path=None, data_reference_name=None)

Parâmetros

Name Description
path
str

O caminho no arquivo de dados.

Default value: None
data_reference_name
str

O nome da referência de dados.

Default value: None

Devoluções

Tipo Description

O objeto de referência de dados.

to_config

Converta o objeto DataReference para o objeto DataReferenceConfiguration.

to_config()

Devoluções

Tipo Description

Um novo objeto DataReferenceConfiguration.