Compartilhar via


Coleta de dados de modelos em produção

APLICA-SE A:Extensão de ML da CLI do Azure v2 (atual)SDK do Python azure-ai-ml v2 (atual)

Neste artigo, você aprenderá sobre a coleta de dados de modelos implantados em pontos de extremidade online do Azure Machine Learning.

O Coletor de Dados do Azure Machine Learning fornece log em tempo real de dados de entrada e saída de modelos implantados em pontos de extremidade online gerenciados ou pontos de extremidade online do Kubernetes. O Azure Machine Learning armazena os dados de inferência registrados no armazenamento de blobs do Azure. Esses dados podem ser usados perfeitamente para monitoramento de modelos, depuração ou auditoria, fornecendo observabilidade para o desempenho de seus modelos implantados.

O coletor de dados fornece:

  • Registro em log de dados de inferência em um local central (Armazenamento de Blobs do Azure)
  • Suporte para pontos de extremidade online gerenciados e pontos de extremidade online do Kubernetes
  • Definição no nível de implantação, permitindo o máximo de alterações em sua configuração
  • Suporte para conteúdo e registro em log personalizado

Modos de log

O coletor de dados fornece dois modos de registro em log: registro em log de carga e registro em log personalizado. O registro em log de carga permite coletar os dados de conteúdo de solicitação HTTP e resposta de seus modelos implantados. Com o registro em log personalizado, o Azure Machine Learning fornece um SDK do Python para registrar os DataFrames do Pandas diretamente do script de pontuação. Usando o SDK do Python de log personalizado, você pode registrar dados de entrada e saída do modelo, além de dados antes, durante e depois de quaisquer transformações de dados (ou pré-processamento).

Obter configuração do coletor de dados.

O coletor de dados pode ser configurado no nível de implantação e a configuração é especificada no momento da implantação. Você pode configurar o destino de Armazenamento de Blobs do Azure que receberá os dados coletados. Você também pode configurar a taxa de amostragem (variando de 0 a 100%) dos dados a serem coletados.

Limitações

A SSE tem as seguintes limitações:

  • O coletor de dados só dá suporte ao registro em log para pontos de extremidade online (ou em tempo real) do Azure Machine Learning (Gerenciado ou Kubernetes).
  • O coletor de dados Python SDK suporta apenas o registro de dados tabulares por meio de DataFrames do pandas.