Condividi tramite


Integrazione di AutoML Feature Store

AutoML può aumentare il set di dati di input originale con funzionalità di tabelle delle funzionalità in Unity Catalog o nell'archivio delle funzionalità dell'area di lavoro legacy .

Requisiti

  • Gli esperimenti di classificazione e regressione richiedono Databricks Runtime 11.3 LTS ML e versioni successive.
  • Gli esperimenti di previsione richiedono Databricks Runtime 12.2 LTS ML e versioni successive.

Selezionare una tabella delle funzionalità usando l'interfaccia utente di AutoML

Dopo aver configurato l'esperimento AutoML, è possibile selezionare una tabella delle funzionalità seguendo questa procedura:

  1. Cliccare Aggiungi funzionalità (facoltativo).

    Selezionare il pulsante Aggiungi funzionalità

  2. Nella pagina Aggiungi funzionalità aggiuntive selezionare una tabella delle funzionalità nel campo Tabella funzionalità.

  3. Per ogni chiave primaria della tabella delle funzionalità, selezionare la chiave di ricerca corrispondente. La chiave di ricerca deve essere una colonna nel set di dati di training fornito per l'esperimento AutoML.

  4. Per le tabelle delle funzionalità delle serie temporali, selezionare la chiave di ricerca timestamp corrispondente. Analogamente, la chiave di ricerca timestamp deve essere una colonna nel set di dati di training fornito per l'esperimento AutoML.

    Selezionare la chiave primaria e le tabelle di ricerca

  5. Per aggiungere altre tabelle delle funzionalità, fare clic su Aggiungi un'altra tabella delle funzionalità e ripetere i passaggi precedenti.

Usare le tabelle delle funzionalità con l'API AutoML

Per usare le tabelle delle funzionalità esistenti, impostare il feature_store_lookups parametro nella specifica di esecuzione di AutoML.

feature_store_lookups = [
  {
     "table_name": "example.trip_pickup_features",
     "lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
  },
  {
      "table_name": "example.trip_dropoff_features",
     "lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
  }
]

Il notebook seguente illustra come unire tabelle delle funzionalità al set di dati di training da usare con AutoML.

Esperimento AutoML con il notebook delle tabelle delle funzionalità

Ottenere il notebook