Lakehouse 教學課程:建立 Lakehouse、內嵌範例資料,以及建置報表
在本教學課程中,您會建置 Lakehouse、內嵌範例資料到 Delta 資料表、視需要套用轉換,然後建立報表。 在本教學課程中,您將了解如何:
- 從資料工程工作負載建立 Lakehouse
- 下載並擷取範例客戶資料
- 將資料表新增至語意模型
- 建置報表
如果您沒有 Microsoft Fabric,請註冊免費試用容量。
必要條件
- 在建立 Lakehouse 之前,您必須先建立 Fabric 工作區。
- 在內嵌 CSV 檔案之前,您必須先設定 OneDrive。 如果您尚未設定 OneDrive,請註冊 Microsoft 365 免費試用:免費試用 - 試用 Microsoft 365 一個月。
建立 Lakehouse
在本章節中,您將從資料工程體驗建立 Lakehouse。
在 Power BI 中,從左側功能表選取工作區。
若要開啟工作區,請在位於頂端的搜尋文字方塊中輸入其名稱,然後從搜尋結果中加以選取。
從位於左下方的切換器中,選取 [資料工程]。
在 [資料工程] 畫面中,選取 [Lakehouse] 以建立 Lakehouse。
在 [新增 Lakehouse] 對話方塊中,在 [名稱] 欄位輸入 wwilakehouse。
選取 [建立] ,以建立並開啟新的 Lakehouse。
內嵌範例資料
在本章節中,您會將範例客戶資料內嵌至 Lakehouse。
注意
如果您尚未設定 OneDrive,請註冊 Microsoft 365 免費試用:免費試用 - 試用 Microsoft 365 一個月。
從 Fabric 範例存放庫下載 dimension_customer.csv 檔案。
在 [首頁] 索引標籤的 [取得 Lakehouse 中的資料] 底下,您會看到將資料載入 Lakehouse 的選項。 選取 [新資料流程 Gen2]。
在新的資料流程畫面上,選取 [從文字/CSV 檔案匯入]。
在 [連線至資料來源] 畫面上 ,選取 [上傳檔案] 圓形按鈕。 拖放您在步驟 1 中下載的 dimension_customer.csv 檔案。 上傳檔案後,選取 [下一步]。
從 [預覽檔案資料] 頁面預覽資料,然後選取 [建立] 繼續並返回資料流程創作區。
在 [查詢設定] 窗格中,將 [名稱] 欄位更新為 dimension_customer。
注意
Fabric 預設會在資料表名稱結尾新增空格和數字。 資料表名稱必須是小寫,且不得包含空格。 請適當地為其重新命名,並從資料表名稱中移除任何空格。
在本教學課程中,您會將客戶資料與 Lakehouse 建立關聯。 如果您有其他想要與 Lakehouse 產生關聯的資料項,您可以新增這些項目:
從功能表項目中,選取 [新增資料目的地],然後選取 [Lakehouse]。 從 [連線到資料目的地] 畫面,視需要登入您的帳戶,然後選取 [下一步]。
瀏覽至工作區中的 wwilakehouse。
如果 dimension_customer 資料表不存在,請選取 [新增資料表] 設定,然後輸入資料表名稱 dimension_customer。 如果資料表已經存在,請選取 [現有資料表] 設定,然後從物件總管中的資料表清單中選擇 [dimension_customer]。 選取下一步。
在 [選擇目的地設定] 窗格中,選取 [取代] 作為 [更新方法]。 選取 [儲存設定] 以返回資料流程創作區。
從資料流程創作區中,您可以輕鬆地根據業務需求來轉換資料。 為了簡單起見,我們在本教學課程中不會進行任何變更。 若要繼續,請選取畫面右下方的 [發佈]。
資料流程名稱旁的旋轉圓形表示正在項目檢視中發佈。 發佈完成時,請選取 ... 並選取 [ 屬性]。 將資料流程重新命名為 Load Lakehouse 資料表 ,然後選取 [儲存]。
選取資料流程名稱旁的 [立即重新整理] 選項,以重新整理資料流程。 此選項會執行資料流程,並將資料從來源檔案移至 Lakehouse 資料表。 進行中時,您會在項目檢視的 [重新整理] 資料行底下看到旋轉圓圈。
重新整理資料流程之後,請在左側導覽列中選取新的 Lakehouse,以檢視 dimension_customer Delta 資料表。
選取要預覽其資料的資料表。 您也可以使用 Lakehouse 的 SQL 分析端點,以 SQL 陳述式查詢資料。 從畫面右上方的 Lakehouse 下拉功能表中選取 [SQL 分析端點]。
選取 dimension_customer 資料表來預覽其資料,或選取 [新增 SQL 查詢] 來撰寫 SQL 陳述式。
下列範例查詢會根據 dimension_customer 資料表的 BuyingGroup 資料行來彙總資料列計數。 SQL 查詢檔案會自動儲存以供日後參考,您可以根據您的需求重新命名或刪除這些檔案。
若要執行指令碼,請選取指令碼檔案頂端的 [執行] 圖示。
SELECT BuyingGroup, Count(*) AS Total FROM dimension_customer GROUP BY BuyingGroup
建置報表
在本節中,您將從內嵌的資料建置報表。
先前所有 Lakehouse 資料表和檢視都會自動新增至語意模型。 在最近的更新中,對於新的 Lakehouse,您必須手動將資料表新增至語意模型。 開啟 Lakehouse 並切換至 [SQL 分析端點] 檢視。 從 [報告] 索引標籤中,選取 [管理預設語意模型],然後選取您要新增至語意模型的資料表。 在此情況下,請選取 dimension_customer 資料表。
若要確保語意模型中的資料表一律同步,請切換至 [SQL 分析端點] 檢視,然後開啟 Lakehouse 設定窗格。 選取 [預設 Power BI 語意模型],然後開啟 [同步處理預設 Power BI 語意模型]。 如需詳細資訊,請參閱預設 Power BI 語意模型。
新增資料表之後,Fabric 會建立與 Lakehouse 同名的語意模型。
您可以從語意模型窗格檢視所有資料表。 您可以選擇從頭開始建立報表、編頁報告,或讓 Power BI 根據您的資料自動建立報告。 在本教學課程中,在 [探索此資料] 底下,選取 [自動建立報表]。 在下一個教學課程中,我們會從頭開始建立報表。
因為資料表是維度,而且其中沒有任何量值,所以 Power BI 會建立資料列計數的量值,並將其彙總到不同的資料行,並建立不同的圖表,如下圖所示。 您可以從頂端功能區選取 [儲存],以儲存此報表供未來使用。 您可以藉由包含或排除其他資料表或資料行,來變更此報表以符合您的需求。