Compartilhar via


Ajuste do desempenho para uploads e downloads com Java

Quando um aplicativo transfere dados usando a biblioteca de clientes do Armazenamento do Azure para Java, há vários fatores que podem afetar a velocidade, o uso de memória e até mesmo o êxito ou a falha da solicitação. Para maximizar o desempenho e a confiabilidade das transferências de dados, é importante ser proativo na configuração das opções de transferência da biblioteca do cliente com base no ambiente em que seu aplicativo é executado.

Este artigo aborda várias considerações para ajustar as opções de transferência de dados. Quando ajustada corretamente, a biblioteca de clientes pode distribuir dados com eficiência entre várias solicitações, o que pode resultar em maior velocidade de operação, uso de memória e estabilidade de rede.

Ajuste de desempenho de uploads

Ajustar corretamente as opções de transferência de dados é fundamental para o desempenho confiável de uploads. As transferências de armazenamento são particionadas em várias subtransferências com base nos valores desses argumentos. O tamanho máximo de transferência com suporte varia de acordo com a operação e a versão do serviço. Portanto, verifique a documentação para determinar os limites. Para obter mais informações sobre limites de tamanho de transferência para o Armazenamento de Blobs, confira Dimensionar destinos para armazenamento de Blobs.

Definir opções de transferência de uploads

Você pode configurar os valores em ParallelTransferOptions para melhorar o desempenho das operações de transferência de dados. Os seguintes valores podem ser ajustados para uploads com base nas necessidades do seu aplicativo:

  • maxSingleUploadSize: o tamanho máximo do blob em bytes para um upload de uma única solicitação.
  • blockSize: o tamanho máximo do bloco a ser transferido para cada solicitação.
  • maxConcurrency: o número máximo de solicitações paralelas emitidas a qualquer momento como parte de uma única transferência paralela.

Observação

As bibliotecas de cliente usarão padrões para cada opção de transferência de dados, se não for fornecida. Esses padrões normalmente têm um bom desempenho em um ambiente de data center, mas provavelmente não são adequados para ambientes de consumidor doméstico. As opções de transferência de dados ajustadas de forma incorreta pode resultar em operações excessivamente longas e até mesmo tempos limite de solicitação. É melhor ser proativo ao testar esses valores e ajustá-los com base nas necessidades do seu aplicativo e ambiente.

maxSingleUploadSize

O valor maxSingleUploadSize é o tamanho máximo do blob em bytes para um upload de uma única solicitação. Esse valor pode ser definido usando o seguinte método:

Se o tamanho dos dados for menor ou igual a maxSingleUploadSize, o blob será carregado com uma única solicitação Put Blob. Se o tamanho do blob for maior que maxSingleUploadSize ou se o tamanho do blob for desconhecido, o blob será carregado em partes usando uma série de chamadas Put Block seguidas por Put Block List.

É importante observar que o valor especificado para blockSize não limita o valor definido para maxSingleUploadSize. O argumento maxSingleUploadSize define uma limitação de tamanho separada de uma solicitação para executar toda a operação de uma só vez, sem subtransferências. Muitas vezes, você deseja que maxSingleUploadSize seja pelo menos tão grande quanto o valor definido para blockSize, se não maior. Dependendo do tamanho da transferência de dados, essa abordagem pode ter um desempenho melhor, pois a transferência é concluída com uma única solicitação e evita a sobrecarga de várias solicitações.

Se você não tiver certeza de qual valor é melhor para sua situação, uma opção segura é definir maxSingleUploadSize como o mesmo valor usado para blockSize.

blockSize

O valor blockSize é o comprimento máximo de uma transferência em bytes ao carregar um blob de blocos em partes. Esse valor pode ser definido usando o seguinte método:

O valor blockSize é o comprimento máximo de uma transferência em bytes ao carregar um blob de blocos em partes. Conforme mencionado anteriormente, esse valor não limita maxSingleUploadSize, que pode ser maior que blockSize.

Para manter os dados em movimento com eficiência, as bibliotecas de cliente nem sempre podem alcançar o valor blockSize de cada transferência. Dependendo da operação, o valor máximo com suporte para o tamanho da transferência pode variar. Para obter mais informações sobre limites de tamanho de transferência para o Armazenamento de Blobs, confira o gráfico em Dimensionar destinos para armazenamento de Blobs.

maxConcurrency

O valor maxConcurrency é o número máximo de solicitações paralelas emitidas a qualquer momento como parte de uma única transferência paralela. Esse valor pode ser definido usando o seguinte método:

Exemplo de código

Verifique se você tem a seguinte diretiva import para usar ParallelTransferOptions para um upload:

import com.azure.storage.blob.models.*;

O exemplo de código a seguir mostra como definir valores para ParallelTransferOptions e incluir as opções como parte de uma instância BlobUploadFromFileOptions. Se você não estiver carregando de um arquivo, poderá definir opções semelhantes usando BlobParallelUploadOptions. Os valores fornecidos neste exemplo não se destinam a ser uma recomendação. Para ajustar adequadamente esses valores, você precisa considerar as necessidades específicas do seu aplicativo.

ParallelTransferOptions parallelTransferOptions = new ParallelTransferOptions()
        .setBlockSizeLong((long) (4 * 1024 * 1024)) // 4 MiB block size
        .setMaxConcurrency(2)
        .setMaxSingleUploadSizeLong((long) 8 * 1024 * 1024); // 8 MiB max size for single request upload

BlobUploadFromFileOptions options = new BlobUploadFromFileOptions("<localFilePath>");
options.setParallelTransferOptions(parallelTransferOptions);

Response<BlockBlobItem> blockBlob = blobClient.uploadFromFileWithResponse(options, null, null);

Neste exemplo, definimos o número máximo de trabalhos de transferência paralela como 2, usando o método setMaxConcurrency. Também definimos maxSingleUploadSize como 8 MiB usando o método setMaxSingleUploadSizeLong. Se o tamanho do blob for menor que 8 MiB, apenas uma única solicitação será necessária para concluir a operação de upload. Se o tamanho do blob for maior que 8 MiB, o blob será carregado em partes com um tamanho máximo de parte de 4 MiB, que definimos usando o método setBlockSizeLong.

Considerações de desempenho para uploads

Durante um upload, as bibliotecas do cliente de armazenamento dividem um determinado fluxo de upload em vários subuploads com base nas opções de configuração definidas por ParallelTransferOptions. Cada subupload tem sua própria chamada dedicada para a operação REST. Para um objeto BlobClient, essa operação é Put Block. A biblioteca de clientes de armazenamento gerencia essas operações REST paralelamente (dependendo das opções de transferência) para concluir o upload completo.

Observação

Os blobs de blocos têm uma contagem máxima de blocos de 50.000 blocos. Então, o tamanho máximo do blob de blocos é 50.000 vezes block_size.

Buffer durante os uploads

A camada REST de Armazenamento não dá suporte à coleta de uma operação de upload REST de onde você parou. As transferências individuais são concluídas ou perdidas. Para garantir a resiliência de uploads de fluxos, as bibliotecas de clientes de armazenamento colocam os dados em buffer para cada chamada REST individual antes de iniciar o upload. Além das limitações de velocidade de rede, esse comportamento de buffer é motivo para considerar um valor menor para blockSize, mesmo ao carregar em sequência. Diminuir o valor de blockSize diminui a quantidade máxima de dados armazenados em buffer em cada solicitação e em cada nova tentativa de uma solicitação com falha. Se você estiver enfrentando tempos limite frequentes durante as transferências de dados de um determinado tamanho, a redução do valor de blockSize reduz o tempo de armazenamento em buffer e pode resultar em um melhor desempenho.

Ajuste de desempenho de downloads

Ajustar corretamente as opções de transferência de dados é fundamental para o desempenho confiável de downloads. As transferências de armazenamento são particionadas em várias subtransferências com base nos valores definidos em ParallelTransferOptions.

Definir opções de transferência de downloads

Os seguintes valores podem ser ajustados para downloads com base nas necessidades do seu aplicativo:

  • blockSize: o tamanho máximo do bloco a ser transferido para cada solicitação. Você pode definir este valor usando o método setBlockSizeLong.
  • maxConcurrency: o número máximo de solicitações paralelas emitidas a qualquer momento como parte de uma única transferência paralela. Você pode definir este valor usando o método setMaxConcurrency.

Exemplo de código

Verifique se você tem a seguinte diretiva import para usar ParallelTransferOptions para um download:

import com.azure.storage.common.*;

O exemplo de código a seguir mostra como definir valores para ParallelTransferOptions e incluir as opções como parte de uma instância BlobDownloadToFileOptions.

ParallelTransferOptions parallelTransferOptions = new ParallelTransferOptions()
        .setBlockSizeLong((long) (4 * 1024 * 1024)) // 4 MiB block size
        .setMaxConcurrency(2);

BlobDownloadToFileOptions options = new BlobDownloadToFileOptions("<localFilePath>");
options.setParallelTransferOptions(parallelTransferOptions);

blobClient.downloadToFileWithResponse(options, null, null);

Considerações de desempenho para downloads

Durante um download, as bibliotecas do cliente de armazenamento dividem uma determinada solicitação de download em vários subdownloads com base nas opções de configuração definidas por ParallelTransferOptions. Cada subdownload tem sua própria chamada dedicada para a operação REST. Dependendo das opções de transferência, as bibliotecas de clientes gerenciarão essas operações REST paralelamente para concluir o download completo.

Próximas etapas