Condividi tramite


Esplorazione

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizza esperienze. Il servizio Personalizza esperienze verrà ritirato il 1° ottobre 2026.

Con l'esplorazione, Personalizza esperienze può continuare a offrire buoni risultati, anche quando cambia il comportamento degli utenti.

Quando Personalizza esperienze riceve una chiamata a Classifica, restituisce un attributo RewardActionID che esegue una delle operazioni seguenti:

  • Usa la pertinenza nota per individuare il comportamento utente più probabile in base al modello di Machine Learning corrente.
  • Usa l'esplorazione, che non individua l'azione con la probabilità più elevata nella classifica.

Personalizza esperienze usa attualmente un algoritmo denominato epsilon greedy per l'esplorazione.

Scelta di un'impostazione di esplorazione

Per configurare la percentuale di traffico da usare per l'esplorazione, nel portale di Azure è disponibile la pagina Configurazione relativa a Personalizza esperienze. Questa impostazione determina la percentuale di chiamate a Classifica che eseguono l'esplorazione.

Personalizza esperienze determina se esplorare o usare l'azione più probabile del modello per ogni chiamata di classificazione. Questo comportamento è diverso rispetto a quanto accade in un framework A/B che blocca una gestione su ID utente specifici.

Procedure consigliate per la scelta di un'impostazione di esplorazione

La scelta di un'impostazione di esplorazione è una decisione aziendale che riguarda la proporzione di interazioni degli utenti da usare per l'esplorazione al fine di migliorare il modello.

Un'impostazione pari a zero annulla molti dei vantaggi offerti da Personalizza esperienze. Con questa impostazione, Personalizza esperienze non usa alcuna interazione degli utenti per individuare le interazioni migliori. Questo comporta una condizione di stallo, una deviazione e infine una riduzione delle prestazioni del modello.

Un'impostazione su un valore troppo elevato annulla i vantaggi derivanti dall'apprendimento del comportamento degli utenti. L'impostazione dell'esplorazione su 100% implica una sequenza casuale costante e qualsiasi informazione sul comportamento degli utenti non influenzerebbe il risultato.

È importante non modificare il comportamento dell'applicazione a seconda che Personalizza esperienze esplori o usi l'azione migliore acquisita. Ciò potrebbe causare distorsioni dell'apprendimento e infine una riduzione delle potenziali prestazioni.

Passaggi successivi

Apprendimento per rinforzo