轉換及對應資料
選取要使用的資料來源後,您將進入 Power Query 編輯器。 Power Query 是用來轉換資料的強大工具。 若要進一步瞭解,請移至 Power Query 使用者介面。
您可能會因以下原因而想轉換資料:
您可能不會對所有已記錄的活動名稱感興趣,因此您希望篩選對於您嘗試挖掘的程序來說重要的特定活動名稱。
您可能會想要將某些活動名稱重新命名為更具描述性且易於理解的名稱。 資料庫中的名稱通常不符合此特性。
您感興趣的可能只是特定日期範圍的資料,而不是整段歷程的資料。
您可能會想組合多個識別碼資料行以形成案例識別碼。 當您要用於程序挖掘的識別碼不存在,或其為應用程式中多個識別碼的組合時,通常會執行此作業。 例如,當客戶提交支援票證時,支援票證可能會指派給多個客戶服務代理程式。 如果您想要分析每個代理程式處理每個票證的方式,請將代理程式識別碼和票證識別碼結合至案例識別碼中。
篩選活動名稱
選取 [活動名稱] 資料行旁的克拉,以顯示 [排序] 與 [篩選] 功能表。
如果有訊息顯示清單可能未完成,請選取載入其他。
只選取您要分析的活動名稱。 取消選取要排除的任何名稱。
或者,您也可以使用文字篩選功能表來進行更進階的篩選。 如需依值篩選的詳細資訊,請移至依資料行中的值篩選。
重新命名活動
- 請確定已選取活動名稱資料行。
- 在工具列上方,選取轉換索引標籤。
- 在工具列上,選取取代值。
- 在要尋找的值下輸入活動名稱,因為它會顯示在您要取代的資料來源中。
- 在取代為下,輸入要在程序圖中顯示的活動名稱。
- 針對要取代的所有值重複此程序。
請減少記錄總數
減少記錄總數的其中一種策略是只使用最新的記錄。 為此,您需要先依時間排序資料。
選取 startTimestamp 資料行旁邊的克拉,開啟排序和篩選功能表。
若要先顯示最近的記錄,請選取遞減排序。
選取確定,然後選取工具列上的保留資料列。
在資料列數下輸入 150000。
選取確定以篩選前 15 萬的資料列。
將多個識別碼合併
您可以使用 Ctrl + 按一下選取要合併的多個資料行。
- 在 [轉換] 索引標籤工具列上,選取合併資料行。
- (選用) 從下拉式清單選取分隔符號。 或者,您也可以選取無。
- 變更名稱 (或記下產生的預設名稱),以便在對應至案例識別碼時選取它。
地圖資料
對應會告知程序探勘功能哪個欄對應到哪個屬性類型 (例如,案例識別碼、活動名稱或時間戳記)。
- 若要瀏覽到「對應」畫面,請選取下一步。
- 使用相應欄旁邊的下拉式功能表,選取其屬性類型。 有關詳細資訊,請遵循屬性類型的說明。
- 使用 CSV 檔案格式從 Azure Data Lake Gen2 擷取資料時,可以使用資料類型欄中的下拉式功能表變更匯入的資料類型。 對於具有數值的欄,請考慮其屬性是連續值 (例如,發票金額設定為數值) 還是分類值 (例如,物料代碼設定為文字)。
- 案例識別碼、活動和開始時間戳記是繼續分析的必要屬性。
- 若要開始分析流程,請選取儲存並分析。