Integrazione di AutoML Feature Store
AutoML può aumentare il set di dati di input originale con funzionalità di tabelle delle funzionalità in Unity Catalog o nell'archivio delle funzionalità dell'area di lavoro legacy .
Requisiti
- Gli esperimenti di classificazione e regressione richiedono Databricks Runtime 11.3 LTS ML e versioni successive.
- Gli esperimenti di previsione richiedono Databricks Runtime 12.2 LTS ML e versioni successive.
Selezionare una tabella delle funzionalità usando l'interfaccia utente di AutoML
Dopo aver configurato l'esperimento AutoML, è possibile selezionare una tabella delle funzionalità seguendo questa procedura:
Cliccare Aggiungi funzionalità (facoltativo).
Nella pagina Aggiungi funzionalità aggiuntive selezionare una tabella delle funzionalità nel campo Tabella funzionalità.
Per ogni chiave primaria della tabella delle funzionalità, selezionare la chiave di ricerca corrispondente. La chiave di ricerca deve essere una colonna nel set di dati di training fornito per l'esperimento AutoML.
Per le tabelle delle funzionalità delle serie temporali, selezionare la chiave di ricerca timestamp corrispondente. Analogamente, la chiave di ricerca timestamp deve essere una colonna nel set di dati di training fornito per l'esperimento AutoML.
Per aggiungere altre tabelle delle funzionalità, fare clic su Aggiungi un'altra tabella delle funzionalità e ripetere i passaggi precedenti.
Usare le tabelle delle funzionalità con l'API AutoML
Per usare le tabelle delle funzionalità esistenti, impostare il feature_store_lookups
parametro nella specifica di esecuzione di AutoML.
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
Il notebook seguente illustra come unire tabelle delle funzionalità al set di dati di training da usare con AutoML.