共用方式為


使用適用於Visual Studio Code 的 Databricks 擴充功能設定 Databricks 專案

適用於 Visual Studio Code 的 Databricks 延伸模組會在延伸模組面板中提供 組態 視圖,可讓您輕鬆地設定和 update Databricks 專案的設定。 這些功能包括目標工作區部署選取器、輕鬆設定驗證和計算、工作區資料夾 sync,以及啟用偵錯所需 Python 虛擬環境的簡單步驟。

當您建立或移轉專案至 Databricks 項目之後,即可使用 Visual Studio Code 的 Databricks 延伸模組內的組態檢視。 請參閱 建立新的 Databricks 專案

注意

Visual Studio Code 的早期版本 Databricks 擴充功能在專案 JSON 檔案中定義組態設定,並在終端機中顯示環境變數為 set。 在發行版本中,專案和環境組態位於 和 databricks.yml 檔案中databricks.env

如果您的專案是 Databricks 資產套件組合,Databricks 擴充 UI 也會提供 套件組合資源 總管和 套件組合變數檢視 來管理您的套件組合資源和變數。 請參閱 Databricks Asset Bundles 擴充功能

變更目標部署工作區

若要 select 或切換 Databricks 專案的部署目標(例如,若要從 dev 目標切換到 prod 目標):

  1. 在 Databricks 延伸模組面板的 [組態] 檢視中,按一下與 目標相關聯的齒輪圖示 (Select Databricks 資產組合)。

    Select Databricks 資產套件組合目標

  2. 命令選擇區中,select 所需的部署目標。

設定目標之後, 就會顯示主機 和部署 模式 。 如需 Databricks 資產配套部署模式的相關信息,請參閱 Databricks 資產套件組合部署模式

您可以修改與專案相關聯之組態檔中的workspace目標databricks.yml設定,來變更工作區主機。 參閲目標

注意

下列適用於 Visual Studio Code 功能的 Databricks 擴充功能只有在目標部署模式開發時才可使用:

  • 使用附加的開發叢集進行配套作業
  • Sync 工作區資料夾中的檔案
  • Select 互動式開發叢集

設定專案的 Databricks 設定檔

當您 建立 Databricks 專案或 將專案移 轉至 Databricks 專案時,您會設定設定檔,其中包含用來連線到 Databricks 的驗證設定。 如果您想要變更所使用的驗證配置檔,請按兩下組態檢視中AuthType 相關聯的齒輪圖示。

如需適用於 Visual Studio Code 驗證之 Databricks 延伸模組的詳細資訊,請參閱 Visual Studio Code Databricks 延伸模組的驗證設定。

Select 執行程式代碼和作業的叢集

使用適用於 Visual Studio Code 的 Databricks 擴充功能,您可以 select 現有的 Azure Databricks 叢集,或建立新的 Azure Databricks 叢集來執行您的程式代碼和作業。 聯機到計算之後,會顯示叢集的標識碼、Databricks 運行時間版本、建立者、狀態和存取模式。 您也可以啟動和停止叢集,並直接流覽至叢集的頁面詳細數據。

提示

如果您不想等候作業叢集啟動,請檢查 叢集選取範圍下方的覆寫作業叢集 ,以在開發模式中使用選取的叢集來執行配套作業。

使用現有的叢集

如果您有想要使用的現有 Azure Databricks 叢集:

  1. 在 [組態] 檢視中,Select 按兩下 [叢集旁的叢集 或齒輪 (設定叢集) 圖示。

    設定叢集

  2. 命令選擇區中,select 您想要使用的叢集。

建立新叢集

如果您沒有現有的 Azure Databricks 叢集,或想要建立新的叢集:

  1. 在 [組態] 檢視中,按兩下 [叢集] 旁的齒輪 (設定叢集) 圖示。

  2. 在命令選擇區,按兩下 [建立新叢集]。

  3. 當系統提示您開啟外部網站(您的 Azure Databricks 工作區),請按兩下 [ 開啟]。

  4. 如果出現提示,請登入您的 Azure Databricks 工作區。

  5. 請遵循指示來 建立叢集

    注意

    Databricks 建議您建立 個人計算 叢集。 這可讓您立即開始執行工作負載,將計算管理額外負荷降至最低。

  6. 建立叢集並執行之後,請返回 Visual Studio Code。

  7. 在 [組態] 檢視中,按兩下 [叢集] 旁的齒輪 (設定叢集) 圖示。

    設定叢集圖示 3

    在命令 選擇區中,按下您想要使用的叢集。

將您的工作區資料夾 Sync 與 Databricks 連結

sync 您可以在 Databricks 延伸模組面板的 [組態] 檢視中,按一下與您的 Databricks 專案相關聯的 工作區資料夾 的遠端 Databricks 工作區資料夾,然後按一下 sync 圖示(開始同步處理)。

注意

適用於 Visual Studio Code 的 Databricks 擴充功能僅適用於其建立的工作區目錄。 除非您已由延伸模組建立,否則您無法在專案中使用現有的工作區目錄。

若要流覽至 Databricks 中的工作區檢視,請按兩下與 [工作區資料夾] 相關聯的外部連結圖示[開啟外部連結] 圖示。

延伸模組會根據 file_path 專案相關聯 Databricks 資產套件組合組態的對應中的 workspace 設定,決定要使用的 Azure Databricks 工作區資料夾。 請參閱 工作區

注意

適用於 Visual Studio Code 的 Databricks 擴充功能只會執行單向、自動同步處理本機 Visual Studio Code 專案到遠端 Azure Databricks 工作區中相關工作區資料夾的檔案變更。 此遠端工作區目錄中的檔案是暫時性的。 請勿從遠端工作區內起始這些檔案的變更,因為這些變更不會同步處理回本機專案。

如需了解舊版 Visual Studio Code Databricks 擴充功能的工作區目錄 sync 功能的使用詳情,請參閱 Select Visual Studio Code Databricks 擴充功能的工作區目錄

Set 設定您的 Python 環境和 Databricks Connect

檢視的 [Python 環境] 區段可讓您輕鬆設定 Python 虛擬開發環境和安裝 Databricks Connect,以執行和偵錯程式代碼和筆記本數據格。 Python 虛擬環境可確保您的專案使用相容的 Python 和 Python 套件版本(在此案例中為 Databricks Connect 套件)。

若要為您的項目設定 Python 虛擬環境 ,請在 延伸模組面板的 [組態 ] 檢視中:

  1. 按兩下 [Python 環境] 底下的紅色 [啟動虛擬環境] 專案。
  2. 命令選擇區中,選擇 select Venv 或 Conda。
  3. Select 您想要安裝的相依性,如果有的話。

若要變更環境,請按兩下與作用中環境相關聯的齒輪圖示 (變更虛擬環境)。

如需安裝 Databricks Connect 的相關信息,其可在 Visual Studio Code 中啟用執行和偵錯程式代碼和筆記本,請參閱 使用 Databricks Connect 偵錯 Visual Studio Code 的 Databricks 延伸模組的程式代碼