使用 Azure 數據總管 Web UI 精靈建立外部數據表
外部數據表是參考儲存在 Azure 數據總管資料庫外部數據的架構實體。 Azure 數據總管 Web UI 可以從記憶體容器擷取範例檔案,並根據這些範例建立架構,以建立外部數據表。 然後,您可以在外部數據表中分析及查詢數據,而不擷取至 Azure 數據總管。 如需簡短概觀,請參閱 外部數據表。 如需建立外部數據表之不同方式的相關信息,請參閱建立和改變外部數據表 Azure 儲存體。 本文說明如何使用建立精靈體驗建立外部數據表。
必要條件
- Azure 訂用帳戶。 建立免費的 Azure 帳戶。
- Azure 資料總管叢集和資料庫。 建立叢集和資料庫。
- 登入 Azure 數據總管 Web UI ,並 新增叢集的連線。
建立外部表格
[ 建立外部數據表 ] 視窗隨即開啟,並已選取 [ 目的地] 索引 標籤。
目的地索引標籤
- [叢集] 和 [資料庫] 字段已預先填入。 您可以從下拉功能表中選取不同的目的地。
- 在 [ 資料表名稱] 中,輸入數據表的名稱。
提示
資料表名稱最多可以有1024個字元,包括英數位元、連字元和底線。 但不支援特殊字元。
- 選取 [下一步:來源]
來源索引標籤
在 [鏈接至容器] 中,有兩種方式可以新增容器:使用 [選取容器] 按鈕新增容器,並使用 [新增 URL] 或 [新增容器] 按鈕新增容器。
您最多可以新增10個來源容器。
使用 [選取容器] 按鈕新增容器
選取 [ 選取容器]。
選擇與您的容器相關聯的相關訂用帳戶和記憶體帳戶。
選取新增按鈕。 驗證完成時,容器鏈接右側會出現綠色檢查。
使用 [新增 URL] 或 [新增容器] 按鈕新增容器
選取 [新增 URL] 或 [新增容器] 按鈕。
使用讀取和清單許可權,輸入來源容器的記憶體 連接字串。 驗證完成時,容器鏈接右側會出現綠色檢查。
檔案篩選
使用 [檔案篩選 ] 篩選數據表應包含的檔案。 您可以根據資料夾路徑、檔案開頭或擴展名來篩選檔案。
架構定義檔案
第一個來源容器會顯示檔案篩選下方的檔案。
- 選取檔案左邊的圓形,以選擇架構定義檔案。 此檔案將用來產生數據表架構。
- 選取 [ 下一步:架構]。 [架構] 索引 標籤 隨即開啟。
結構描述索引標籤
在索引標籤的右側,您可以預覽數據。 在左側,您可以將分割區新增至數據表定義,以更快速地存取源數據,並達到更好的效能。
注意
對應不是外部數據表定義的一部分,而且在此精靈中不受支援。 如有必要,稍後可以 設定 對應。 某些功能,例如刪除 CSV 檔案中的最後一個數據行,或變更 JSON 檔案中的數據行名稱,需要對應才能正常運作。
選取 [ 新增分割區]。
分割區視窗隨即開啟。 分割區是在檔案的子路徑上定義,您可以使用 [路徑前置詞] 字段來改變。 針對您想要套用的每個分割區,填寫欄位,如下所示:
欄位 描述 必要/選用 分割區名稱 用於識別數據分割。 名稱可以是任意名稱。 必要 類型 數據分割數據行的數據類型。 必要 資料行 用於數據分割的數據行。 根據 URL 路徑來分割虛擬數據行。 必要 函式 套用至用於數據分割的數據行的函式。 選擇性 函式自變數 要用於數據分割函數的自變數。 如果使用函式,則為必要。 路徑前置詞 定義數據分割之檔案的子路徑。 此前置詞會變更外部數據表的 URL,如 Uri 預覽方塊中所見,而且應該符合架構定義的檔案 URI。 選擇性 日期時間模式 將用來建構數據表 URI 路徑的日期格式。 選擇性 例如,數據分割名稱 CustomerName 建議要分割的值位於 URL 的客戶名稱部分。 上述範例宣告了兩個分割區:一個數據分割在客戶名稱上,另一個分割區則宣告在URL中內嵌的日期。
注意
虛擬數據行會顯示為架構的一部分,做為從檔案路徑擷取的數據行數據,稍後可以在查詢中使用此數據。
選取 [新增數據分割 ] 以新增另一個分割區。
選取儲存。 您新增的資料分割現在會出現在左窗格中的 [資料分割] 清單中。 數據分割數據行無法在預覽中變更。
選取 [ 下一步:建立數據表]。 建立數據表時, [外部數據表已成功建立] 視窗隨即開啟。
若要檢視用來建立資料表的命令,請選取 [檢視] 命令。
若要復原建立外部數據表,請選取 [工具>復原]。
查詢外部數據表
產生的數據表包含所有符合上面所定義準則之檔案的數據。 您可以使用 函式 external_table()
來查詢此資料表。 如需如何查詢外部數據表的詳細資訊,請參閱 查詢外部數據表。