2019 giugno
Queste funzionalità e i miglioramenti della piattaforma Azure Databricks sono stati rilasciati a giugno 2019.
Nota
Le versioni vengono gestite in staging. L'account Azure Databricks potrebbe non essere aggiornato fino a una settimana dopo la data di rilascio iniziale.
Il supporto dell’istanza Lsv2 è disponibile a livello generale
24 giugno - 26, 2019: versione 2.100
Azure Databricks offre ora il supporto completo per la serie di macchine virtuali Lsv2 per carichi di lavoro con velocità effettiva elevata e operazioni di I/O al secondo elevate.
Integrazione di RStudio non più limitata a cluster con concorrenza elevata
6 giugno - 11, 2019: versione 2.99
È ora possibile abilitare RStudio Server in cluster standard in Azure Databricks, oltre ai cluster a concorrenza elevata già supportati. Indipendentemente dalla modalità cluster, l'integrazione di RStudio Server continua a richiedere di disabilitare l'opzione di terminazione automatica per il cluster. Vedere RStudio in Azure Databricks.
MLflow 1.0
3 giugno 2019
MLflow è una piattaforma open source per gestire il ciclo di vita completo di Machine Learning. Con MLflow, i data scientist possono tenere traccia e condividere esperimenti in locale o nel cloud, creare pacchetti e condividere modelli tra framework e distribuire modelli praticamente ovunque.
Siamo lieti di annunciare il rilascio di MLflow 1.0 oggi. La versione 1.0 non solo contrassegna la maturità e la stabilità delle API, ma aggiunge anche una serie di funzionalità e miglioramenti richiesti di frequente:
- L'interfaccia della riga di comando è stata riorganizzata e ora include comandi dedicati per artefatti, modelli, database (database di rilevamento) e server (il server di rilevamento).
- La ricerca del server di rilevamento supporta una versione semplificata della
SQL WHERE
clausola . Oltre a supportare metriche di esecuzione e parametri, la ricerca è stata migliorata per supportare alcuni attributi di esecuzione e tag utente e di sistema. - Aggiunge il supporto per le coordinate x nell'API di rilevamento. I componenti di visualizzazione dell'interfaccia utente di MLflow supportano ora anche il tracciato delle metriche rispetto ai valori delle coordinate x forniti.
- Aggiunge un
runs/log-batch
endpoint API REST, nonché i metodi Python, R e Java per registrare più metriche, parametri e tag con una singola richiesta API. - Per il rilevamento, il client MLflow 1.0 è ora supportato in Windows.
- Aggiunge il supporto per HDFS come back-end dell'archivio artefatti.
- Aggiunge un comando per compilare un contenitore Docker il cui punto di ingresso predefinito serve il modello di funzione Python MLflow specificato alla porta 8080 all'interno del contenitore.
- Aggiunge un sapore di modello ONNX sperimentale.
È possibile visualizzare l'elenco completo delle modifiche nel log delle modifiche di MLflow.
Databricks Runtime 5.4 per Machine Learning
3 giugno 2019
Databricks Runtime 5.4 ML è basato su Databricks Runtime 5.4 (EoS). Contiene molte delle più diffuse librerie di Machine Learning, tra cui TensorFlow, PyTorch, Keras e XGBoost, e fornisce il training di TensorFlow distribuito usando Horovod.
Include le nuove funzionalità seguenti:
- Integrazione di MLlib con MLflow (anteprima pubblica).
- Hyperopt con nuova classe SparkTrials preinstallata (anteprima pubblica).
- L'output horovodRunner inviato da Horovod al nodo driver Spark è ora visibile nelle celle del notebook.
- Pacchetto Python XGBoost preinstallato.
Per informazioni dettagliate, vedere Databricks Runtime 5.4 per ML (EoS).
Databricks Runtime 5.4
3 giugno 2019
Databricks Runtime 5.4 è ora disponibile. Databricks Runtime 5.4 include apache Spark 2.4.2, librerie Python, R, Java e Scala aggiornate e le nuove funzionalità seguenti:
- Delta Lake in Databricks aggiunge Ottimizzazione automatica (anteprima pubblica)
- Usare l'IDE e il server notebook preferiti con Databricks Connect
- Utilità di libreria disponibili a livello generale
- Origine dati di file binari
Per informazioni dettagliate, vedere Databricks Runtime 5.4 (EoS).