Usare JupyterLab con Databricks Connect per Python

Articolo
07/16/2024

Nota

Questo articolo illustra Databricks Connect per Databricks Runtime 13.3 LTS e versioni successive.

Questo articolo illustra come usare Databricks Connect per Python con JupyterLab. Databricks Connect consente di connettere i server notebook, gli IDE e altre applicazioni personalizzate più diffusi ai cluster di Azure Databricks. Consultare Cos’è Databricks Connect?.

Nota

Prima di iniziare a usare Databricks Connect, è necessario configurare il client Databricks Connect.

Per usare Databricks Connect with JupyterLab and Python (Connettersi a JupyterLab e Python), seguire queste istruzioni.

Per installare JupyterLab, con l'ambiente virtuale Python attivato, eseguire il comando seguente dal terminale o dal prompt dei comandi:
```
pip3 install jupyterlab
```
Per avviare JupyterLab nel Web browser, eseguire il comando seguente dall'ambiente virtuale Python attivato:
```
jupyter lab
```
Se JupyterLab non viene visualizzato nel Web browser, copiare l'URL che inizia con localhost o 127.0.0.1 dall'ambiente virtuale e immetterlo nella barra degli indirizzi del Web browser.
Creare un nuovo notebook: in JupyterLab fare clic su File Nuovo notebook nel menu principale, selezionare Python 3 (ipykernel) e fare clic su Seleziona.> >
Nella prima cella del notebook immettere il codice di esempio o il proprio codice. Se si usa il proprio codice, è necessario inizializzare DatabricksSession almeno come illustrato nel codice di esempio.
Per eseguire il notebook, fare clic su Esegui > tutte le celle. Tutto il codice viene eseguito localmente, mentre tutto il codice che coinvolge le operazioni del dataframe viene eseguito nel cluster nell'area di lavoro remota di Azure Databricks e le risposte di esecuzione vengono inviate al chiamante locale.
Per eseguire il debug del notebook, fare clic sull'icona del bug (Abilita debugger) accanto a Python 3 (ipykernel) sulla barra degli strumenti del notebook. Impostare uno o più punti di interruzione e quindi fare clic su Esegui > tutte le celle. Tutto il codice viene sottoposto a debug in locale, mentre tutto il codice Spark continua a essere eseguito nel cluster nell'area di lavoro remota di Azure Databricks. Il codice principale del motore Spark non può essere sottoposto a debug direttamente dal client.
Per arrestare JupyterLab, fare clic su Arresta file>. Se il processo JupyterLab è ancora in esecuzione nel terminale o nel prompt dei comandi, arrestare questo processo premendo Ctrl + c e immettendo y per confermare.

Per istruzioni di debug più specifiche, vedere Debugger.

Condividi tramite

Usare JupyterLab con Databricks Connect per Python

Commenti e suggerimenti

Risorse aggiuntive