Compartilhar via


Considerações de desempenho para o armazenamento do Azure NetApp Files com acesso esporádico

Os conjuntos de dados nem sempre são usados ativamente. Até 80% dos dados em um conjunto podem ser considerados "esporádicos", o que significa que ele não está em uso ou não foi acessado recentemente. Ao armazenar dados em armazenamento de alto desempenho, como o Azure NetApp Files, o dinheiro gasto na capacidade que está sendo usada está essencialmente sendo desperdiçado, pois os dados de acesso esporádico não exigem armazenamento de alto desempenho até que sejam acessados novamente.

O armazenamento do Azure NetApp Files com acesso esporádico destina-se a reduzir os custos de armazenamento em nuvem no Azure. Há considerações de desempenho em casos de uso específicos que precisam ser considerados.

Acessar dados que foram movidos para as camadas de armazenamento esporádico incorre em mais latência, especialmente para E/S aleatória. Na pior das hipóteses, todos os dados acessados podem estar na camada fria, portanto, cada solicitação precisaria realizar uma recuperação dos dados. É incomum que todos os dados em um conjunto de dados usado ativamente estejam na camada de armazenamento esporádico, portanto, é improvável que essa latência seja observada.

Quando a política de recuperação de acesso esporádico padrão é selecionada, as leituras sequenciais de E/S são atendidas diretamente da camada de armazenamento esporádico e não são repovoadas na camada de armazenamento frequente. Os dados de leitura aleatória são repovoados na camada de acesso frequente, aumentando o desempenho das leituras subsequentes. As otimizações para cargas de trabalho sequenciais geralmente reduzem a latência incorrida pela recuperação de nuvem em comparação com leituras aleatórias e aprimoram o desempenho geral.

Em um teste recente realizado usando o armazenamento Standard com acesso esporádico para o Azure NetApp Files, os resultados a seguir foram obtidos.

Observação

Todos os resultados publicados são apenas para fins de referência. Os resultados não são garantidos, pois o desempenho nas cargas de trabalho de produção pode variar devido a vários fatores.

Leituras sequenciais de 100% na camada quente/fria (trabalho único)

No cenário a seguir, um trabalho em uma VM D32_V5 (máquina virtual) foi usado em um volume do Azure NetApp Files de 50 TiB usando a camada de desempenho Ultra. Tamanhos de bloco diferentes foram usados para testar o desempenho em camadas de armazenamento frequente e esporádico.

Observação

O máximo para o nível de serviço Ultra é 128 MiB/s por tebibyte de capacidade alocada. Um volume regular do Azure NetApp Files pode gerenciar uma taxa de transferência de até aproximadamente 5.000 MiB/s.

O grafo a seguir mostra o desempenho da camada de armazenamento esporádico para este teste usando uma variedade de profundidades de fila. A taxa de transferência máxima para apenas uma VM foi de aproximadamente 400 MiB/s.

Gráfico de taxa de transferência de camada de armazenamento esporádico em tamanhos de blocos variados.

O desempenho da camada de armazenamento frequente foi cerca de 2,75x melhor, atingindo aproximadamente 1.180 MiB/s.

Gráfico de taxa de transferência de camada de armazenamento frequente em tamanhos de blocos variados.

Este grafo mostra uma comparação lado a lado do desempenho da camada de armazenamento esporádico e frequente com um tamanho de bloco de 256K.

Gráfico de taxa de transferência em 'iodepths' variáveis com um trabalho.

O que causa latência em camadas de armazenamento frequente e esporádico?

A latência na camada de armazenamento frequente é um fator do próprio sistema de armazenamento, em que os recursos do sistema são esgotados quando mais E/S são enviados para o serviço do que podem ser tratados a qualquer momento. Como resultado, as operações precisam ficar em fila até que as operações enviadas anteriormente possam ser concluídas.

A latência na camada de armazenamento esporádico geralmente é vista com as operações de recuperação de nuvem: solicitações pela rede de E/S para o repositório de objetos (cargas de trabalho sequenciais) ou reidratação de blocos frios na camada de armazenamento frequente (cargas de trabalho aleatórias).

Resumo de resultados

  • Quando uma carga de trabalho é 100% sequencial, a taxa de transferência da camada de armazenamento esporádico diminui cerca de 47% em relação à camada de armazenamento frequente (3.330 MiB/s em comparação com 1.742 MiB/s).
  • Quando uma carga de trabalho é 100% aleatória, a taxa de transferência da camada de armazenamento esporádico diminui cerca de 88% em relação à camada de armazenamento frequente (2.479 MiB/s em comparação com 280 MiB/s).
  • A queda de desempenho para a camada quente ao realizar cargas de trabalho sequenciais de 100% (3.330 MiB/s) e 100% aleatórias (2.479 MiB/s) foi de aproximadamente 25%. A queda de desempenho da camada de armazenamento esporádico ao realizar cargas de trabalho sequenciais de 100% (1.742 MiB/s) e 100% aleatórias (280 MiB/s) foi de aproximadamente 88%.
  • Quando uma carga de trabalho contém qualquer porcentagem de E/S aleatória, a taxa de transferência geral da camada de armazenamento esporádico é mais próxima de 100% aleatória do que 100% sequencial.
  • As leituras da camada de armazenamento esporádico caíram cerca de 50% ao passar de 100% sequencial para uma mistura sequencial/aleatória de 80/20.
  • A E/S sequencial pode tirar proveito de um cache readahead no Azure NetApp Files, o que a E/S aleatória não faz. Esse benefício para E/S sequencial ajuda a reduzir as diferenças gerais de desempenho entre as camadas de armazenamento frequente e esporádico.

Recomendações e consideração

  • Se sua carga de trabalho frequentemente altera os padrões de acesso de maneira imprevisível, o acesso frio pode não ser ideal devido às diferenças de desempenho entre camadas de armazenamento frequente e esporádico.
  • Se sua carga de trabalho contiver qualquer porcentagem de E/S aleatória, as expectativas de desempenho ao acessar dados na camada de armazenamento esporádico deverão ser ajustadas adequadamente.
  • Configure a janela de esporadicidade e as configurações de recuperação de acesso esporádico para corresponder aos padrões de carga de trabalho e minimizar a quantidade de recuperação de camada de armazenamento esporádico.
  • O desempenho do acesso frio pode variar dependendo do conjunto de dados e da carga do sistema em que o aplicativo está em execução. É recomendável realizar testes relevantes com seu conjunto de dados para entender e considerar a variabilidade do desempenho do acesso esporádico.

Próximas etapas