Partilhar via


Escalabilidade e desempenho

Importante

A partir de 20 de setembro de 2023, você não poderá criar novos recursos do Personalizador. O serviço de Personalizador será aposentado no dia 1º de outubro de 2026.

Sites e aplicativos de alto desempenho e alto tráfego têm dois fatores principais a considerar com o Personalizer para escalabilidade e desempenho:

  • Mantendo baixa latência ao fazer chamadas de API de classificação
  • Garantir que a taxa de transferência do treinamento acompanhe a entrada do evento

A personalização pode retornar uma classificação rapidamente, com a maior parte da duração da chamada dedicada à comunicação por meio da API REST. O Azure dimensionará automaticamente a capacidade de responder a solicitações rapidamente.

Cenários de baixa latência

Alguns aplicativos exigem latências baixas ao retornar uma classificação. São necessárias latências baixas:

  • Para evitar que o usuário espere uma quantidade notável de tempo antes de exibir o conteúdo classificado.
  • Para ajudar um servidor que está enfrentando tráfego extremo, evite amarrar o tempo de computação escasso e as conexões de rede.

Escalabilidade e taxa de transferência de treinamento

O Personalizer funciona atualizando um modelo que é retreinado com base em mensagens enviadas de forma assíncrona pelo Personalizer após APIs de Classificação e Recompensa. Essas mensagens são enviadas usando um Azure EventHub para o aplicativo.

É improvável que a maioria dos aplicativos atinja a taxa de transferência máxima de ingresso e treinamento do Personalizer. Embora atingir esse máximo não torne o aplicativo lento, isso implicaria que as filas do hub de eventos estão sendo preenchidas internamente mais rápido do que podem ser limpas.

Como estimar seus requisitos de taxa de transferência

  • Estime o número médio de bytes por evento de classificação, adicionando os comprimentos dos documentos JSON de contexto e ação.
  • Divida 20 MB/s por essa média estimada de bytes.

Por exemplo, se a sua carga útil média tem 500 recursos e cada um tem cerca de 20 caracteres, então cada evento é de aproximadamente 10 kb. Com essas estimativas, 20.000.000 / 10.000 = 2.000 eventos/seg, o que representa cerca de 173 milhões de eventos/dia.

Se você estiver atingindo esses limites, entre em contato com nossa equipe de suporte para obter conselhos de arquitetura.

Próximos passos

Crie e configure o Personalizador.