Сбор данных из моделей в рабочей среде
ОБЛАСТЬ ПРИМЕНЕНИЯ:Расширение машинного обучения Azure CLI версии 2 (current)Python SDK azure-ai-ml версии 2 (current)
В этой статье вы узнаете о сборе данных из моделей, развернутых в Машинное обучение Azure сетевых конечных точек.
Машинное обучение Azure сборщик данных предоставляет ведение журнала входных и выходных данных из моделей, развернутых в управляемых сетевых конечных точках или сетевых конечных точках Kubernetes. Машинное обучение Azure хранит данные вывода в журнале в хранилище BLOB-объектов Azure. Затем эти данные можно легко использовать для мониторинга моделей, отладки или аудита, тем самым обеспечивая возможность наблюдения за производительностью развернутых моделей.
Сборщик данных предоставляет:
- Ведение журнала данных вывода в центральное расположение (Хранилище BLOB-объектов Azure)
- Поддержка управляемых сетевых конечных точек и сетевых конечных точек Kubernetes
- Определение на уровне развертывания, позволяющее максимально изменить конфигурацию.
- Поддержка полезных данных и пользовательского ведения журнала
Режимы ведения журнала
Сборщик данных предоставляет два режима ведения журнала: ведение журнала полезных данных и настраиваемое ведение журнала. Ведение журнала полезных данных позволяет собирать полезные данные HTTP-запроса и ответа из развернутых моделей. С помощью пользовательского ведения журнала Машинное обучение Azure предоставляет пакет SDK python для ведения журналов pandas DataFrames непосредственно из скрипта оценки. С помощью пользовательского пакета SDK для ведения журнала Python можно записывать входные и выходные данные модели в дополнение к данным до, во время и после любых преобразований данных (или предварительной обработки).
Конфигурация сборщика данных
Сборщик данных можно настроить на уровне развертывания, а конфигурация указана во время развертывания. Вы можете настроить назначение хранилища BLOB-объектов Azure, которое получит собранные данные. Вы также можете настроить частоту выборки (от 0 до 100 %) собираемых данных.
Ограничения
Сборщик данных имеет следующие ограничения:
- Сборщик данных поддерживает ведение журнала только для сетевых конечных точек (или в режиме реального времени Машинное обучение Azure) (управляемых или Kubernetes).
- Пакет SDK для Python для сборщика данных поддерживает только табличные данные журналов с помощью pandas DataFrames.