List Databricks Marketplace 中的數據產品
本文章說明如何成為 Databricks 市集供應商,以及如何為您的資料產品建立 Databricks 市集清單。
開始之前
若要在 Databricks Marketplace 中 list 產品,您必須同意提供者原則,而且您的帳戶和工作區必須符合特定需求。
原則:
若要在 Marketplace 平台上的交換
帳戶和工作區需求:
Databricks市集使用 Delta Sharing 來管理資料產品的安全共用。 若要進行 Delta 共享,需確保您的 Databricks 工作區已開啟 Unity Catalog功能。 因此您的 Azure Databricks 帳戶與工作區必須符合下列需求:
- Azure Databricks 帳戶應該在進階方案上。
- 已啟用 Unity Catalog的 Azure Databricks 工作區。 請參閱 啟用 Unity 工作區 Catalog。 您不需要啟用 Unity 的所有工作區 Catalog。 您可以只建立一個來管理市集清單。
如果您有符合這些準則的工作區,您的使用者將能夠檢視市集首頁。 建立和管理清單需要其他權限。 這些會列舉於下列各章節中。 如果您不想讓使用者能夠檢視市集首頁,請連絡您的 Azure Databricks 帳戶團隊。
權限需求:
若要註冊為僅限私人交換的供應商,您必須是 Azure Databricks 帳戶管理員。請參閱 註冊成為 Databricks 市集供應商。
註冊成為 Databricks 市集供應商
您註冊成為 Databricks 市集供應商的方式取決於您打算在公用市集中建立清單,還是只透過私人交換來建立清單。 在私人交換中,只有屬於交換成員的家庭用戶可以瀏覽、檢視及要求存取清單。 請參閱 在 Databricks 市集中建立和管理私人交換。
若要成為僅限私人交換的供應商,您可以使用供應商主機註冊。 若要建立公用清單,您可以透過 Databricks 資料合作夥伴計劃套用。
申請可建立公用清單的供應商
注意
如果您的組織已經在 Databricks 合作夥伴計劃中,而且您有興趣成為市集 供應商,請略過下列說明並連絡 partnerops@databricks.com
。
在Databricks 資料合作夥伴計劃頁面,按下立即套用。
在下一個頁面上,按下立即套用。
輸入您的電子郵件地址,然後按下立即套用。
填寫申請表單。
在申請表單底部,系統會詢問您感興趣的 Databricks 合作夥伴計畫。 Select Marketplace。
Databricks 合作夥伴團隊會與您連絡以完成申請流程。 當您被批准後,可在已啟用 Unity-Catalog的 Azure Databricks 工作區中使用供應商控制台。 若要存取供應商主機,使用者必須具有市集系統管理員角色。
註冊為私人交換供應商
若要註冊為僅限私人交換的提供者,請使用提供者控制台中啟動 Get 作為提供者 頁面。
若要註冊為私人交換供應商:
身為 Azure Databricks 帳戶管理員,登入您的 Azure Databricks 工作區。
在側邊欄中,按下市集。
在市集頁面右上方角落,按下市集供應商主機。
如果您的帳戶還未作為提供者上線,提供者控制台將顯示 Get 以提供者身份啟動 的頁面,該頁面會引導您完成將帳戶啟用為私人交換提供者的整個流程。
在接受市集條件,按下Databricks 市集私人供應商條件連結以檢閱條件。
若要接受條件,按下接受私人供應商條件按鈕。
這會帶您前往新瀏覽器索引標籤中的 Azure Databricks 帳戶主機,並開啟設定>功能啟用索引標籤。如果您尚未登入,您可能需要登入帳戶主機。
注意
如果您有多個 Azure Databricks 帳戶,您應該確認您登入的帳戶包含您要存取供應商主機的工作區。
在功能啟用索引標籤上,啟用市集交換供應商選項。
返回工作區中的 提供者控制台,然後點擊 Refresh 頁面。 請勿使用瀏覽器 refresh 頁面功能。
幾分鐘後,指派市集管理員按鈕隨即出現。 按下它以在帳戶主機中開啟您的用戶頁面。 在角色 索引標籤上,啟用 市集管理員。
您可以選擇將市集系統管理員角色指派給另一名使用者或使用者。 如果您這樣做,他們可以從這裡繼續流程。 如果您將角色指派給自己,您可以繼續此流程。
回到工作區中 提供者控制台,然後按一下 [Refresh] 頁面。 請勿使用瀏覽器 refresh 頁面功能。
幾分鐘後,建立供應商設定檔按鈕隨即出現。 按下它以開啟建立設定檔頁面。
注意
系統可能需要幾分鐘的時間才能完成指派市集系統管理員角色。 如果您繼續建立提供者配置檔,並看到錯誤指出您沒有 Marketplace 系統管理員角色,請再等候幾分鐘,refresh 頁面,然後重試。
要建立您的供應商設定檔,請按照建立您的市集供應商設定檔中的指示,從第5步開始。
建立您的第一個私人交換。 請參閱 在 Databricks 市集中建立和管理私人交換。
指派市集系統管理員角色
如果您註冊為私人交換供應商,則會在註冊流程中執行此工作。 除非您想要以市集系統管理員身分在 Azure Databricks 帳戶中啟用其他使用者,否則您可以略過本章節中的指示。
核准為 Marketplace 提供者之後,您必須至少 grant 一個 Marketplace 系統管理員角色的使用者。 存取市集供應商主機以及建立和管理市集供應商設定檔和清單時,需要此角色。 Azure Databricks 帳戶管理員可以執行 grant 角色。
- 身為帳戶管理員,登入帳戶主機。
- 按下使用者管理。
- 尋找並按下使用者名稱。
- 在角色索引標籤上,開啟市集系統管理員。
建立市集供應商設定檔
您的供應商設定檔可告知潛在家庭用戶您的身分,並將您的資料產品分組為單一品牌或身分識別。 一般而言,數據提供者有一個配置檔,但可以 list 多個數據產品。 如果您想要多個設定檔,請連絡您的 Azure Databricks 帳戶團隊。
如果您是公用供應商,您可以在供應商申請核准之後建立設定檔。 如果您是僅限私人交換的供應商,請在註冊流程的最後一個步驟建立您的設定檔,從此處提供的流程中的第5步驟開始。
需要權限:市集系統管理員角色
建立設定檔:
- 登入您將用來建立 shares 和列表的 Azure Databricks 工作區。
- 在側邊欄中,按下市集。
- 在市集頁面右上方角落,按下市集供應商主機。
- 在供應商主機頁面設定檔索引標籤上,按下建立設定檔。
- 輸入下列資訊。 所有欄位皆為必填。
- 供應商名稱:使用家庭用戶將辨識的名稱。 家庭用戶可以依供應商名稱篩選清單。
- 標誌:拖放或瀏覽至您想要在清單中使用的標誌影像檔。
- 描述:清楚且準確地描述您的組織。 包含詳細數據,例如您通常提供服務或代表的產業,以及您通常 list的數據資產類型。 家庭用戶可以在檢視您的設定檔和所有清單時看到此描述。
- 組織網站:連結至貴組織的網站。 家庭用戶可以關注此連結來深入瞭解您的組織。 此連結會出現在所有清單上。
- 商業電子郵件:輸入 Databricks 可用來傳送通知的電子郵件位址。 家庭用戶看不到這項資訊。
- 支援電子郵件:輸入家庭用戶可用來要求支援的電子郵件地址。 此連結會出現在所有清單上。
- 服務條款連結:此連結會顯示在您的所有清單上。 您可以在清單層級輸入不同的連結來覆寫此連結。
- 隱私權原則:此連結會顯示在您的所有清單上。 您可以在清單層級輸入不同的連結來覆寫此連結。
- 儲存設定檔。
如果您是 Marketplace 提供者時,如果這項資訊有任何變更,update 您的配置檔。 您的設定檔必須準確且保持在最新狀態。
建立 shares
在您啟用支援 Delta Sharing 的 Azure Databricks 帳戶,以及啟用支援 Unity Catalog的 Azure Databricks 工作區之後,您就可以建立用來在 Marketplace 中共用數據的 shares。
共用是 Delta Sharing 物件。 它是一個由 tables、views、volumes和 AI 模型組成的集合,可以作為一個單位來共享和保護。 Tables 可以與任何使用者共用。 Volumes、AI 模型和筆記本只能與可存取 Unity Catalog的 Azure Databricks 工作區的取用者共用。
注意
若要 list 可供取用者使用的數據產品,您必須在建立清單時包含共用。 另一方面,需要您核准家庭用戶請求的清單則不需要您在清單中包含分享。 您稍後可以在任何商務合約完成且已核准家庭用戶的要求之後,建立分享。 如果這是您想要執行的動作,請直接略過到建立清單。
將數據 tables、views或 volumes 新增至 Unity Catalog 中繼存放區。
若要瞭解如何在 Unity Catalog中建立這些數據資產,請參閱:
建立分享,並將這些資料資產新增至分享。
若要瞭解如何建立和 updateshares,請參閱 建立和管理 Delta Sharing的 shares。
所需的權限:
- 若要建立共用,您必須是具有 Unity Catalog 中繼存放區
CREATE SHARE
許可權的中繼存放區管理員或使用者,where 您要共用的數據註冊。 - 若要將 table、磁碟區或檢視新增至共用,您必須是共用擁有者、具有包含數據資產之 schema
USE SCHEMA
許可權,以及具有數據資產SELECT
許可權。 您必須保留SELECT
權限,資產才能繼續分享。 如果您遺失,收件者就無法透過分享存取資產。 因此,Databricks 建議您使用群組作為分享擁有者。
如需共用 tables、volumes和 views需求的詳細資訊,包括計算和數據類型需求,請參閱 建立和管理差異共用的 shares。
- 若要建立共用,您必須是具有 Unity Catalog 中繼存放區
建立共享之後,您可以創建或 update 一個參考該共享的市集清單。
筆記本範例:樣本筆記本
除了 tables、volumes和 views之外,Databricks 強烈建議您也共用 Azure Databricks 筆記本。 筆記本是示範範例使用案例並將 table 屬性可視化的絕佳方式。 您的清單可以包含家庭用戶可以匯入其工作區的範例筆記本預覽版。
如需建立筆記本的詳細資訊,請參閱Databricks 筆記本簡介。 如果您需要建立有效範例筆記本的輔助說明,請連絡dataproviders@databricks.com
。
注意
清單 UI 中的範例筆記本顯示和預覽版無法在 Chrome Incognito 模式下運作。
下列範例示範如何建立有效的範例筆記本。 其中包括為清單建立有效範例筆記本的指導。
適用於數據 providers 的 Marketplace 入門筆記本
建立清單
Marketplace 商品列表可讓消費者流覽、select及存取您的數據產品。 所有資料集清單都會自動與 Azure Databricks 工作區上的家庭用戶,以及 Power BI、pandas 和 Apache Spark 等第三方平台上的家庭用戶共用。
注意
某些數據資產,例如 Databricks volumes,只能與有權限存取支援 Unity Catalog的 Databricks 工作區的使用者分享。 不過,Tables可以與所有使用者共用。 如果您在共享中同時包含 tables 和 volumes,那麼無法存取 Unity Catalog啟用的工作空間的使用者只能存取表格式數據。
需要的權限:市集系統管理員角色。 如果您要建立及管理個人化清單(需要提供者核准才能完成的清單),您也必須擁有CREATE RECIPIENT
和USE RECIPIENT
權限。 請參閱 Unity Catalog 權限和可安全設置的對象。
建立清單:
登入至您的 Azure Databricks 工作區。
在側邊欄中,按下市集。
在市集頁面右上方角落,按下市集供應商主機。
在供應商主機頁面清單索引標籤上,按下建立清單。
在新清單頁面上,輸入您的清單資訊。
如需指示,請參閱清單欄位和選項。
您可以在發佈之前儲存草稿並檢視預覽版。 當您按下發佈時,清單會立即出現在市集中。
清單欄位和選項
本章節描述每個新清單分頁欄位和選項。 它也提供建立有效清單的建議。
清單名稱:每個清單都應該有唯一的名稱,可協助家庭用戶瞭解其提供的內容。
建議:
- 少於 100 個字元
- 字首大寫(將主要單字大寫)。
範例
美國人口普查 2022
簡短描述:擴充清單名稱之資料集的簡短說明。 此欄位會出現在清單磚和家庭用戶搜尋結果中。
建議:
- 少於 100 個字元 不得超過 160 個字元。
- 句子大小寫(只將第一個單字、任何適當的名詞或縮寫大寫)。
範例
2020 年美國人口計數和人口統計的一般資訊
供應商設定檔:您的組織或公司名稱。 從下拉功能表中選擇Select。 您的設定檔是由 Azure Databricks 建立,作為合作夥伴組織核准流程的一部分。
服務條款:連結至服務條款的 URL,以適當使用共用數據資產。
服務條款必須可公開存取,而且不需要登入。
公用市集:所有家庭用戶都可以瀏覽和檢視公用 Databricks 市集中的清單。
私人交換:只有屬於私人交換成員的家庭用戶,由您或其他市集管理員建立,才能瀏覽、檢視及要求清單。 請參閱 在 Databricks 市集中建立和管理私人交換。
您必須在下拉式 list中 select 至少一個私人交換。
數據立即可供使用:Select 此選項,讓取用者直接從 Marketplace 取得共用數據的存取權,而不需要您的核准(但需要接受服務條款)。 從下拉式功能表中選擇分享。 此選項通常用於範例和公用資料集。
如果您尚未建立想要包括的分享,請按下下拉式功能表底部的+ 建立新分享。 系統會帶您前往建立新的分享對話框。
如果您在這裡 select 或建立的共用不包含任何數據或資產,則會出現一則包含 [新增數據] 按鈕的訊息。 點擊它即可移至 [Catalog 資源管理器],where 您可以將 tables 新增至共用。
如需瞭解有關建立 shares 並將 tables 新增至 shares的更多資訊,包括所需的許可權,請參閱 建立和管理 shares 以進行 Delta Sharing。
需要使用者請求批准:Select 選擇此選項即可要求您的批准,使用者才能存取共享資料。 如果您需要商務合約,才能將資料產品提供給家庭用戶,請使用此選項。 您必須與 Databricks 市集外部的家庭用戶管理商務合約。 您可以使用家庭用戶電子郵件地址來開始通訊。
您可以在供應商主機>的家庭用戶要求分頁上檢視和處理家庭用戶要求。請參閱Databricks 市集中的管理您的資料產品的要求。
類別:Select 最多五個類別,可供取用者用來篩選清單。 類別也會在清單磚和詳細資料頁面上顯示為標籤。
新增屬性:屬性是選用的。 其中包括地理涵蓋範圍、update 頻率、時間範圍、數據源和數據集大小等字段。 新增屬性可協助家庭用戶深入瞭解您的資料產品。 Select 您可以隨意選擇任意多的屬性。
描述:資料的詳細描述應包括清單中的資料和資產摘要。
支援基本 RTF 格式設定(也就是粗體、斜體、項目符號和編號清單),使用 Markdown 語法。 若要預覽您的內容,請使用描述欄位工具列最右邊的按鈕。
建議:
- 包括權益和使用案例。
- 提供如何使用數據和範例使用案例的簡短指導。
- 包括範例資料集和欄位名稱。
- 指定架構、tables與 columns。
- 使用一致的標點符號和語法。
- 在段落之間新增額外的斷行。
- 檢查拼字和文法。
- 請勿重複您在新增屬性下定義的屬性。
範例
概觀:
美國人口和住宅普查是 2020 年美國的官方人口和房屋計數。 它提供了社會和經濟快照。 2020 年人口普查於 2021 年 3 月 6 日舉行,是第 23 次人口普查。
使用案例:
- 根據年齡和性別等人口變數將客戶分組。
- 自定特定取用者群組的產品供應項目。
此資料集中包含的資訊:
- 人口估計值
- 人口要素(出生、死亡、移民)
- 此數據可以依年齡、性別和種族等特性排序,以及依國家、州和縣位置排序
範例筆記本:Databricks 強烈建議您共用範例筆記本,以示範如何使用資料。 最多新增十個筆記本。 您必須儲存清單並返回清單,才能上傳範例筆記本。
如需建立筆記本的詳細資訊,請參閱筆記本範例:範例筆記本和Databricks 筆記本簡介。
文件:指向文件的 URL,可協助使用者使用或瞭解您的資料 set(例如,數據集詞彙表)。
隱私權原則:連結到您隱私權原則的 URL。
隱私權原則必須可公開存取,而且不需要登入。
使用系統 tables(公開預覽)和儀錶板分析消費者活動
如果您的帳戶中已啟用 系統 tables,您可以使用 Marketplace 系統 tables 來分析刊登項目上的消費者活動。 如需詳細資訊,請參閱 Marketplace 系統 tables 參考。
您也可以使用供應商分析儀表板來監視清單 views、請求和安裝。 儀表板會從系統 tables匯入資料。 請參閱 使用儀表板監視清單使用計量。
資源配額
Unity Catalog 對所有可保護的物件強制執行資源配額,包括每個中繼資料存放區的 Marketplace 清單,以及每個帳戶的 providers。 這些配額列在資源限制中。 如果你預期超過這些資源限制,請連絡你的 Azure Databricks 帳戶團隊。
您可以使用 Unity Catalog 資源配額 API 來監視配額使用量。 請參閱 監控 Unity Catalog 資源配額的使用情況。