從數據流 Gen1 遷移至數據流 Gen2
本文以 Power BI 數據流建立者為目標。 其提供指引和理由,協助將其數據流遷移至 Dataflow Gen2,在 Data Factory 中用於 Microsoft Fabric。
注意
數據流 Gen2 是新一代數據流,可提供新功能和改善的體驗。 Gen2 資料流與 Power BI 資料流並存,其現在稱為 資料流 Gen1。
若要了解資料流 Gen1 與資料流 Gen2 之間的差異,請參閱 從資料流世代 1 過渡到資料流世代 2。
背景
Microsoft Fabric 已演變為自助式和 IT 管理企業數據的整合式平臺。 隨著數據量和複雜性的指數成長,Fabric的客戶要求其企業解決方案必須具有可擴展性、安全性、易於管理,並能夠讓即使是最大型組織中的所有使用者都能夠存取。
近年來,Microsoft已取得長足的進步,為 網狀架構容量提供可調整的雲端功能。 為此,Fabric 中的 Data Factory 可立即為數十年來所建置的數據整合開發人員和數據整合解決方案提供龐大的生態系統。 它利用了一組完整的特性和功能,遠遠超出了前幾代可用的可比較功能。
當然,客戶現在會詢問是否有機會藉由將其裝載在 Fabric 內來合併其數據整合解決方案。 他們通常會詢問如下的問題:
- 我們依賴的所有數據流功能是否在數據流 Gen2 中運作?
- 哪些功能僅適用於數據流 Gen2?
- 我們如何將現有的數據流遷移至數據流 Gen2?
- 企業數據擷取Microsoft藍圖為何?
本文將說明上述許多問題的解答。
注意
移轉至 Fabric 容量的決定取決於每個客戶的需求。 客戶應仔細評估權益,以做出明智的決策。 我們預期隨著時間的推移,自然過渡到 Dataflow Gen2,而我們的意圖是,讓這個過程在客戶感覺安心的條件下進行。
若要清楚,目前沒有任何計劃取代Power BI資料流或Power Platform數據流。 不過,優先將投資放在企業數據擷取的數據流 Gen2 上,因此 Fabric 容量所提供的值會隨著時間增加。 選擇網狀架構容量的客戶將受益於與 Microsoft Fabric 產品藍圖的協同一致。
自助與企業數據整合的匯聚
網狀架構中的項目合併可藉由共置資源來簡化探索、共同作業和管理。 它可讓中央IT小組更輕鬆地採用並整合熱門的自助專案。 同時,它可讓符合公司標準的任務關鍵性數據移動和轉換服務運作,包括數據譜系和監視。
為了支援創作者的協作與可擴展需求,Fabric 中的數據流 Gen2 引進了 快速複製,利用 Fabric 的後端基礎結構在轉換期間 儲存和處理 中繼數據,以有效地導入大量數據。 它可以順暢地處理數 TB 的數據。 數據流建立者可以為其轉換的數據指定 目的地,例如 Fabric lakehouse、warehouse、eventhouse 或 Azure SQL Database,以促進更好的數據管理和可及性。 更重要的是,透過 Copilot 和 的最新生成式 AI 功能整合,藉由提供智慧型代碼生成和自動化重複性任務來提升數據準備體驗,並提供更簡單且更快速的路徑來建立複雜的解決方案。
藉由使用通用平臺,工作流程會簡化,這會導致企業與IT之間的共同作業增強。 因此,組織能夠將其數據解決方案調整為企業層級,確保管理大量數據的高效能、彈性和效率。
織物容量
由於分散式架構,網狀架構 對整體負載、時態性尖峰和高並行性較不敏感。 藉由將容量合併到較大容量的 Fabric SKU 中,客戶可以達到更高的效能和傳輸量。
功能比較
下表提供 Power BI 數據流和/或 Fabric 數據流 Gen2 中支援的功能。
特徵 | Power BI 數據流 Gen1 | 網狀架構數據流 Gen2 |
---|---|---|
連線能力 | ||
支援所有 Power Query 數據源 | 是的 | 是的 |
聯機至 Power BI Desktop、Excel 或 Power Apps 中的數據流,並從中載入數據 | 是的 | 是的 |
延展性 | ||
快速複製,支援大規模資料匯入,利用數據流中的資料管線 複製活動 | 不 | 是的 |
預定的資料更新,確保數據保持最新狀態 | 是的 | 是的 |
累加式重新整理,它會使用原則將累加式數據載入自動化,並可協助提供近乎實時的報告 | 是的 | 是的 |
數據管線協調流程,可讓您將 數據流活動 新增至數據管線,並建立協調的條件式事件 | 不 | 是的 |
人工智慧 | ||
適用於 Data Factory 的智能助手,提供智能化代碼生成功能,可輕鬆轉換數據,並生成代碼說明,協助更好地理解複雜任務。 | 不 | 是的 |
認知服務,其使用人工智慧 (AI) 來套用 Azure 認知服務的不同演算法,以擴充自助數據準備 | 是的 | 無 1 |
自動化機器學習(AutoML),使商務分析師能夠直接在 Fabric 中訓練、驗證及調用機器學習模型。 | 已淘汰的 2 | |
Azure Machine Learning 整合,其會將自定義模型公開為可在 Power Query 編輯器中叫用的動態 Power Query 函式 | 是的 | 無 1 |
內容管理 | ||
數據譜系檢視,可協助使用者瞭解及評估數據流專案相依性 | 是的 | 是的 |
部署管線,其管理網狀架構內容的生命週期 | 是的 | 是的 |
平臺延展性和復原能力 | ||
Premium 容量 架構,可支援增加規模和效能 | 是的 | 是的 |
多重地理 支援,可協助跨國客戶解決區域、特定產業或組織的數據駐地需求。 | 是 3 | 是的 |
安全性 | ||
虛擬網路 (VNet) 數據閘道 連線能力,讓 Fabric 能夠順暢地在組織的虛擬網路中運作 | 不 | 是的 |
內部部署數據閘道 連線能力,這可讓您安全地存取組織內部部署數據源與網狀架構之間的數據 | 是的 | 是的 |
Azure 服務標籤 支援,這是一組已定義的 IP 位址,可自動管理,以將更新或變更的複雜度降到最低 | 是的 | 是的 |
治理 | ||
內容 背書,以推廣或認證有價值的高品質布料產品 | 是的 | 是的 |
Microsoft Purview 整合,協助客戶管理和管理網狀架構專案 | 是的 | 是的 |
Microsoft資訊保護 (MIP) 敏感度標籤,並與適用於雲端應用程式的 Microsoft Defender 整合 數據外泄防護 (DLP) | 是的 | 是的 |
監控和診斷記錄 | ||
增強的 重新整理記錄,使您能夠詳細評估數據流重新整理期間發生的情況。 | 不 | 是的 |
監視中樞,其提供 Fabric 項目的監視功能 | 不 | 是的 |
Microsoft網狀架構容量計量應用程式,其提供網狀架構容量的監視功能 | 是的 | 是的 |
稽核記錄,追蹤用戶在 Fabric 和 Microsoft 365 的活動 | 是的 | 是的 |
1 若要瞭解如何建立呼叫 Azure AI API 端點的自定義函式,請參閱 教學課程:從儲存在 Power BI中的文字擷取關鍵片語。
2 自動化機器學習 (AutoML) 已被取代。 如需詳細資訊,請參閱 此官方公告。
考慮事項
移轉至Dataflow Gen2之前,還有其他考慮要納入規劃。
授權
您需要 Pro 或 Premium Per User (PPU) 授權,才能發佈或管理 Power BI 數據流 (Dataflow Gen1)。 相反地,您只需要Microsoft Fabric(免費)授權,才能在 Premium 容量工作區中撰寫數據流 Gen2。
移轉案例
當您移轉數據流時,重要的是要超越僅僅複製現有解決方案的思考方式。 相反地,建議您利用數據流 Gen2 的最新創新和功能,將您的解決方案現代化。 此方法可確保您的解決方案可支援企業日益增長的需求。
在 移轉案例一文中,會說明數種升級、盤點和使用加速器的方法,例如 Power Query 範本。 這些方法有助於確保專案的無縫升級。
藍圖
相關內容
如需本文的詳細資訊,請參閱下列資源: