共用方式為


使用外部平臺存取 Databricks Marketplace 中的數據產品

本文說明如何在未啟用 Unity Catalog的 Databricks 工作區的情況下存取 Databricks Marketplace 中的數據產品。 您可以使用 Delta Sharing 開放式共用連接器,使用許多常見的平臺來存取 Marketplace 數據,包括 Microsoft Power BI、Microsoft Excel、pandas、Apache Spark 和非 Unity Catalog Databricks 工作區。 只有表格式數據集可在外部平臺上使用(例如,不是 Databricks 筆記本、volumes或模型)。

重要

如果您有已啟用 Unity Catalog的 Azure Databricks 工作區,您應該使用 Unity Catalog存取共享數據。 請參閱 在 Databricks Marketplace 中存取資料產品(具備 Unity Catalog功能的工作區)

開始之前

若要流覽 Databricks Marketplace 上的數據產品清單,您可以使用下列其中一項:

若要要求存取數據產品,不論平台為何,您都必須有 Azure Databricks 工作區。

如果您沒有,您可以 get 免費試用。 按兩下 [開啟 Marketplace] 上的 [免費試用],並依照提示開始試用。

流覽外部平臺上可存取的 Databricks Marketplace 清單

若要尋找您想要的數據產品,只需流覽或搜尋 Databricks Marketplace 中的數據產品清單即可。 只有 數據 set(表格式數據)產品類型可以使用外部平臺或非 Unity-Catalog Azure Databricks 工作區來共用。

  1. 移至 marketplace.databricks.com 或登入您的 Azure Databricks 工作區,然後按兩下 [Marketplace iconMarketplace]。

    注意

    或者,您可以使用 Azure Databricks 工作區頂端的全域搜尋列來搜尋 Marketplace 清單。 請參閱搜尋工作區物件

  2. 瀏覽或搜尋您想要的數據產品。

    您可以依提供者名稱、產品類型、類別、成本(免費或付費)或關鍵詞搜尋來篩選清單。 只有 數據 set 產品類型可供使用外部平臺進行存取。

    如果您已登入 Azure Databricks 工作區,您也可以選擇只檢視私人交換中可用的私人清單。 請參閱 參與私人交流

Get 存取外部平臺上可存取的數據產品

若要要求存取數據產品,您必須登入 Azure Databricks 工作區,即使您將在外部平臺上使用共用數據產品也一樣。 某些數據產品可立即使用,而其他則需要使用提供者介面來核准和交易完成。

Get 對數據產品的即時存取

立即可用的數據產品只需要您要求它們並同意條款。 這些數據產品會列在 [Marketplace 登陸] 頁面上的 [免費] 和 [立即可用的 ] 標題底下,在清單磚上識別為 [免費],並識別為 [列表詳細數據] 頁面上的 [立即可用 ]。

  1. 當您在 Marketplace 登陸頁面上找到感興趣的清單時,請按下清單以開啟清單詳細數據頁面。

  2. 按一下[Get 立即存取] 按鈕。

  3. 更多選項 中,select在外部平臺上

  4. 接受 Databricks 條款及條件。

  5. 點擊 Get 立即存取

  6. 按兩下 [下載認證檔案] 按鈕,以 get 認證檔案,您和您的小組可以使用該檔案來存取第三方數據平臺和非 Unity Catalog Databricks 工作區來存取共享數據。

    重要

    認證檔案只能下載一次。 下載文件之後,下載按鈕會保持作用中,但後續的下載會輪替為新的認證。 舊的認證會在一天或其原始到期日之後到期,無論時間早於哪一個。 同時只能有兩個 credentials 是活躍的。

  7. 將認證檔案儲存在安全的位置。

    請勿與應該具有共享數據存取權的使用者群組以外的任何人共用認證檔案。 如果您需要與組織中的某人共用,Databricks 建議使用密碼管理員。

若要瞭解如何使用您選擇的平臺存取共享數據,請參閱 使用 Delta Sharing 開啟共用連接器存取共享數據。

要求需要提供者核准的數據產品

某些數據產品需要提供者核准,通常是因為涉及商業交易,或提供者可能偏好為您自定義數據產品。 這些清單會在清單詳細數據頁面上識別為 [依要求 ],並包含 [要求存取 ] 按鈕。

  1. 當您在 Marketplace 登陸頁面上找到感興趣的清單時,請按下清單以開啟清單詳細數據頁面。

  2. 按兩下 [ 要求存取] 按鈕。

  3. 輸入您用於資料產品的名稱、公司和簡短描述。

  4. 點選 [其他選項] 並在外部平臺上[select]。

  5. 接受 Databricks 條款及條件,然後按兩下 [ 要求存取]。

  6. 當提供者完成對要求的檢閱時,您會收到電子郵件通知。

    您也可以在 Marketplace 的 [我的要求] 頁面上監視要求的進度。 請參閱 管理共用 Databricks Marketplace 數據產品。 不過,後續的任何交易都會使用提供者通訊和付款平臺。 Databricks Marketplace 上不會直接處理任何商業交易。

  7. 當您的交易完成時,您會收到來自數據提供者的通知電子郵件,清單會顯示 [ 下載認證檔案 ] 按鈕。 按下此按鈕來下載認證檔案,您和您的小組可以使用第三方數據平臺和非 Unity Catalog Databricks 工作區來存取共享數據。

    您也可以在 [我的要求] 下方的 Marketplace 中找到清單。 當認證準備好下載時,數據產品會出現在 [ 已安裝的數據產品 ] 索引標籤上。

    重要

    認證檔案只能下載一次。 下載文件之後,下載按鈕會保持作用中,但後續的下載會輪替為新的認證。 舊的認證會在一天或其原始到期日之後到期,無論時間早於哪一個。 只能同時啟動兩個 credentials。

  8. 將認證檔案儲存在安全的位置。

    請勿與應該具有共享數據存取權的使用者群組以外的任何人共用認證檔案。 如果您需要與組織中的某人共用,Databricks 建議使用密碼管理員。

若要瞭解如何使用您選擇的平臺存取共享數據,請參閱 使用 Delta Sharing 開啟共用連接器存取共享數據。

使用 Delta Sharing 開啟共用連接器存取共享數據

若要使用外部平臺或非 Unity-Catalog Azure Databricks 工作區來存取已使用 Databricks Marketplace 共用的數據集,您需要從 Marketplace 清單下載的認證檔案。 您可以使用此認證檔案,使用 Delta Sharing 開啟共用連接器來存取共享數據。

如需使用非 Unity-Catalog Azure Databricks 工作區、Apache Spark、pandas 和 Power BI 存取及讀取共用數據的完整指示,請參閱 使用 Delta Sharing 開放共享來讀取共用數據 recipients

如需完整的 Delta 共用連接器 list,以及如何使用這些連接器的相關資訊,請參閱 Delta Sharing 開放原始碼文件

使用 Marketplace 共用至外部平臺的限制

某些 tables 需要消費者端(例如國家/地區)的 partition 資訊。 在開放共享通訊協定中,此資訊無法對共享提供,因此無法存取 table。 傳回下列錯誤:「收件者驗證失敗:數據受限於未套用至會話中目前收件者的屬性。 請連絡數據提供者以解決問題。