使用 Apache Spark 轉換 Azure Synapse Link for Dataverse 資料
您可以使用 Azure Synapse Link 將您的 Microsoft Dataverse 資料連線至 Azure Synapse Analytics,以探索您的資料並加快深入解析速度。 本文將介紹如何使用 Synapse 工作區中提供的 Apache Spark 引擎來轉換 Dataverse 資料。
注意
Azure Synapse Link for Microsoft Dataverse 先前被稱為匯出至資料湖。 服務的重新命名已在 2021 年 5 月生效,並將繼續匯出資料至 Azure Data Lake 以及 Azure Synapse Analytics。
先決條件
本節說明在使用 Azure Synapse Link for Dataverse 服務後,透過 Apache Spark 轉換 Dataverse 資料所需的先決條件。
Azure Synapse Link for Dataverse。 本指南假設您已經使用 Azure Synapse Link for Dataverse 將 Dataverse 資料匯出。
儲存體帳戶存取。 您必須要在儲存體帳戶被授與下列角色負責人:、儲存體 Blob 資料讀者、儲存體 Blob 資料參與者或者儲存體 Blob 資料負責人。
Synapse 管理員。 您必須在 Synapse 工作室中獲得 Synapse 管理員角色存取權。
使用 Apache Spark 筆記本轉換您的資料
在 Power Apps 中,從清單選取您想要的 Azure Synapse Link,然後選取移至 Azure Synapse workspace。
展開資料庫,選取您的 Dataverse 容器。 您所匯出的資料表會顯示在左側邊欄的資料表目錄下。
在想要的表格上按一下滑鼠右鍵,然後選取新增筆記本 > 載入至 DataFrame。
從下拉式功能表中選取一個集區,將筆記本附加到 Apache Spark 集區中。 如果您沒有 Apache Spark 集區,請選取管理集區來建立一個。
新增程式碼儲存格以轉換您的資料。 選取每個儲存格左邊的播放按鈕,或從頂端欄選取全部執行,以執行個別儲存格。