Поделиться через


Сбор данных из моделей в рабочей среде

ОБЛАСТЬ ПРИМЕНЕНИЯ:Расширение машинного обучения Azure CLI версии 2 (current)Python SDK azure-ai-ml версии 2 (current)

В этой статье вы узнаете о сборе данных из моделей, развернутых в Машинное обучение Azure сетевых конечных точек.

Машинное обучение Azure сборщик данных предоставляет ведение журнала входных и выходных данных из моделей, развернутых в управляемых сетевых конечных точках или сетевых конечных точках Kubernetes. Машинное обучение Azure хранит данные вывода в журнале в хранилище BLOB-объектов Azure. Затем эти данные можно легко использовать для мониторинга моделей, отладки или аудита, тем самым обеспечивая возможность наблюдения за производительностью развернутых моделей.

Сборщик данных предоставляет:

  • Ведение журнала данных вывода в центральное расположение (Хранилище BLOB-объектов Azure)
  • Поддержка управляемых сетевых конечных точек и сетевых конечных точек Kubernetes
  • Определение на уровне развертывания, позволяющее максимально изменить конфигурацию.
  • Поддержка полезных данных и пользовательского ведения журнала

Режимы ведения журнала

Сборщик данных предоставляет два режима ведения журнала: ведение журнала полезных данных и настраиваемое ведение журнала. Ведение журнала полезных данных позволяет собирать полезные данные HTTP-запроса и ответа из развернутых моделей. С помощью пользовательского ведения журнала Машинное обучение Azure предоставляет пакет SDK python для ведения журналов pandas DataFrames непосредственно из скрипта оценки. С помощью пользовательского пакета SDK для ведения журнала Python можно записывать входные и выходные данные модели в дополнение к данным до, во время и после любых преобразований данных (или предварительной обработки).

Конфигурация сборщика данных

Сборщик данных можно настроить на уровне развертывания, а конфигурация указана во время развертывания. Вы можете настроить назначение хранилища BLOB-объектов Azure, которое получит собранные данные. Вы также можете настроить частоту выборки (от 0 до 100 %) собираемых данных.

Ограничения

Сборщик данных имеет следующие ограничения:

  • Сборщик данных поддерживает ведение журнала только для сетевых конечных точек (или в режиме реального времени Машинное обучение Azure) (управляемых или Kubernetes).
  • Пакет SDK для Python для сборщика данных поддерживает только табличные данные журналов с помощью pandas DataFrames.