Jak działa usługa Personalizacja
Ważne
Od 20 września 2023 r. nie będzie można tworzyć nowych zasobów usługi Personalizacja. Usługa Personalizacja jest wycofywana 1 października 2026 r.
Zasób Personalizacja , pętla uczenia maszynowego, używa uczenia maszynowego do tworzenia modelu, który przewiduje najwyższą akcję dla zawartości. Model jest trenowany wyłącznie na podstawie danych wysyłanych do niego za pomocą wywołań Ranga i Nagroda . Każda pętla jest całkowicie niezależna od siebie.
Interfejsy API klasyfikacji i nagrody wpływają na model
Akcje można wysyłać z funkcjami i funkcjami kontekstowymi do interfejsu API rangi. Interfejs API rangi decyduje się na użycie jednego z następujących elementów:
- Wykorzystanie: bieżący model do podjęcia decyzji o najlepszej akcji na podstawie przeszłych danych.
- Eksplorowanie: wybierz inną akcję zamiast akcji górnej. Ta wartość procentowa jest konfigurowana dla zasobu usługi Personalizacja w witrynie Azure Portal.
Możesz określić wynik nagrody i wysłać ten wynik do interfejsu API nagrody. Interfejs API nagrody :
- Zbiera dane do trenowania modelu, rejestrując funkcje i wyniki nagród dla każdego wywołania rangi.
- Używa tych danych do aktualizowania modelu na podstawie konfiguracji określonej w zasadach uczenia.
System wywołujący usługę Personalizacja
Na poniższej ilustracji przedstawiono przepływ architektury wywołujący wywołania rangi i nagrody:
Akcje można wysyłać z funkcjami i funkcjami kontekstowymi do interfejsu API rangi.
- Personalizator decyduje, czy wykorzystać bieżący model, czy eksplorować nowe opcje dla modelu.
- Wynik klasyfikacji jest wysyłany do usługi EventHub.
Górna ranga jest zwracana do systemu jako identyfikator akcji nagrody. System przedstawia zawartość i określa wynik nagrody na podstawie własnych reguł biznesowych.
System zwraca wynik nagrody do pętli szkoleniowej.
- Gdy usługa Personalizacja otrzyma nagrodę, nagroda zostanie wysłana do usługi EventHub.
- Ranga i nagroda są skorelowane.
- Model AI jest aktualizowany na podstawie wyników korelacji.
- Aparat wnioskowania jest aktualizowany przy użyciu nowego modelu.
Personalizator ponownie szkoli model
Personalizator ponownie szkoli model na podstawie ustawienia aktualizacji częstotliwości modelu w zasobie Personalizacja w witrynie Azure Portal.
Usługa Personalizacja używa wszystkich aktualnie przechowywanych danych na podstawie ustawienia Przechowywanie danych w ciągu kilku dni w zasobie usługi Personalizacja w witrynie Azure Portal.
Badania nad personalizacją
Personalizacja opiera się na najnowocześniejszej nauce i badaniach w dziedzinie uczenia wzmacniania, w tym dokumentów, działań badawczych i bieżących obszarów eksploracji w microsoft Research.
Następne kroki
Dowiedz się więcej o najważniejszych scenariuszach dotyczących usługi Personalizacja