DataReference Classe
Representa uma referência aos dados num arquivo de dados.
Uma DataReference representa um caminho num arquivo de dados e pode ser utilizada para descrever como e onde os dados devem ser disponibilizados numa execução. Já não é a abordagem recomendada para o acesso e entrega de dados no Azure Machine Learning. O conjunto de dados suporta o acesso a dados a partir do armazenamento de Blobs do Azure, Ficheiros do Azure, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, base de dados SQL do Azure e Base de Dados do Azure para PostgreSQL através da interface unificada com capacidades de gestão de dados adicionadas. Recomenda-se que utilize o conjunto de dados para ler dados nos seus projetos de machine learning.
Para obter mais informações sobre como utilizar o conjunto de dados do Azure ML em dois cenários comuns, veja os artigos:
Construtor de Classe DataReference.
- Herança
-
builtins.objectDataReference
Construtor
DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)
Parâmetros
Name | Description |
---|---|
datastore
Necessário
|
O arquivo de dados a referenciar. |
data_reference_name
|
O nome da referência de dados. Default value: None
|
path_on_datastore
|
O caminho relativo no armazenamento de cópia de segurança da referência de dados. Default value: None
|
mode
|
A operação na referência de dados. Os valores suportados são "montar" (a predefinição) e "transferir". Utilize o modo de "transferência" quando o script espera um caminho específico (por exemplo, codificado) para os dados de entrada.
Neste caso, especifique o caminho com o Com o modo de "montagem", é criado um diretório temporário com os dados montados e uma variável de ambiente $AZUREML_DATAREFERENCE_<data_reference_name> é definido com o caminho para o diretório temporário. Se transmitir uma DataReference para a lista de argumentos de um passo de pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local no runtime. Default value: mount
|
path_on_compute
|
O caminho no destino de computação para a referência de dados. Default value: None
|
overwrite
|
Indica se deve substituir os dados existentes. Default value: False
|
datastore
Necessário
|
O arquivo de dados a referenciar. |
data_reference_name
Necessário
|
O nome da referência de dados. |
path_on_datastore
Necessário
|
O caminho relativo no armazenamento de cópia de segurança da referência de dados. |
mode
Necessário
|
A operação na referência de dados. Valores suportados "montar" (a predefinição) e "download". Utilize o modo de "transferência" quando o script espera um caminho específico (por exemplo, codificado) para os dados de entrada.
Neste caso, especifique o caminho com o Com o modo de "montagem", é criado um diretório temporário com os dados montados e uma variável de ambiente $AZUREML_DATAREFERENCE_<data_reference_name> é definido com o caminho para o diretório temporário. Se transmitir uma DataReference para a lista de argumentos de um passo de pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local no runtime. |
path_on_compute
Necessário
|
O caminho no destino de computação para a referência de dados. |
overwrite
Necessário
|
Indica se deve substituir os dados existentes. |
Observações
Uma DataReference define a localização dos dados e a forma como os dados são utilizados no enlace de computação de destino (montagem ou carregamento). O caminho para os dados no arquivo de dados pode ser a raiz /, um diretório no arquivo de dados ou um ficheiro no arquivo de dados.
Métodos
as_download |
Mude a operação de referência de dados para transferir. A transferência de DataReference só suporta o Blob do Azure e a Partilha de Ficheiros do Azure. Para transferir dados do Blob do Azure, da Partilha de Ficheiros do Azure, do Azure Data Lake Gen1 e do Azure Data Lake Gen2, recomendamos que utilize o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets. |
as_mount |
Mudar a operação de referência de dados para montagem. A montagem DataReference só suporta o Blob do Azure. Para montar dados no Blob do Azure, na Partilha de Ficheiros do Azure, no Azure Data Lake Gen1 e no Azure Data Lake Gen2, recomendamos a utilização do Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets. |
as_upload |
Mude a operação de referência de dados para carregar. Para obter mais informações sobre que computação e arquivos de dados suportam o carregamento dos dados, consulte: https://aka.ms/datastore-matrix. |
create |
Create uma DataReference com DataPath e DataPathComputeBinding. |
path |
Create uma instância dataReference com base no caminho especificado. |
to_config |
Converta o objeto DataReference para o objeto DataReferenceConfiguration. |
as_download
Mude a operação de referência de dados para transferir.
A transferência de DataReference só suporta o Blob do Azure e a Partilha de Ficheiros do Azure. Para transferir dados do Blob do Azure, da Partilha de Ficheiros do Azure, do Azure Data Lake Gen1 e do Azure Data Lake Gen2, recomendamos que utilize o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_download(path_on_compute=None, overwrite=False)
Parâmetros
Name | Description |
---|---|
path_on_compute
|
O caminho na computação para a referência de dados. Default value: None
|
overwrite
|
Indica se deve substituir os dados existentes. Default value: False
|
Devoluções
Tipo | Description |
---|---|
Um novo objeto de referência de dados. |
as_mount
Mudar a operação de referência de dados para montagem.
A montagem DataReference só suporta o Blob do Azure. Para montar dados no Blob do Azure, na Partilha de Ficheiros do Azure, no Azure Data Lake Gen1 e no Azure Data Lake Gen2, recomendamos a utilização do Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e utilizar o Conjunto de Dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_mount()
Devoluções
Tipo | Description |
---|---|
Um novo objeto de referência de dados. |
as_upload
Mude a operação de referência de dados para carregar.
Para obter mais informações sobre que computação e arquivos de dados suportam o carregamento dos dados, consulte: https://aka.ms/datastore-matrix.
as_upload(path_on_compute=None, overwrite=False)
Parâmetros
Name | Description |
---|---|
path_on_compute
|
O caminho na computação para a referência de dados. Default value: None
|
overwrite
|
Indica se deve substituir os dados existentes. Default value: False
|
Devoluções
Tipo | Description |
---|---|
Um novo objeto de referência de dados. |
create
Create uma DataReference com DataPath e DataPathComputeBinding.
static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)
Parâmetros
Name | Description |
---|---|
data_reference_name
|
O nome da referência de dados a criar. Default value: None
|
datapath
|
[Obrigatório] O caminho de dados a utilizar. Default value: None
|
datapath_compute_binding
|
[Obrigatório] O enlace de computação do datapath a utilizar. Default value: None
|
Devoluções
Tipo | Description |
---|---|
Um objeto DataReference. |
path
Create uma instância dataReference com base no caminho especificado.
path(path=None, data_reference_name=None)
Parâmetros
Name | Description |
---|---|
path
|
O caminho no arquivo de dados. Default value: None
|
data_reference_name
|
O nome da referência de dados. Default value: None
|
Devoluções
Tipo | Description |
---|---|
O objeto de referência de dados. |
to_config
Converta o objeto DataReference para o objeto DataReferenceConfiguration.
to_config()
Devoluções
Tipo | Description |
---|---|
Um novo objeto DataReferenceConfiguration. |