將資料載入 Parallel Data Warehouse
您可以透過整合服務、bcp 公用程式、dwloader 命令列載入器或 SQL INSERT 陳述式,將資料載入或插入至 SQL Server Parallel Data Warehouse (PDW)。
載入環境
若要載入資料,您需要一部或多部載入伺服器。 您可以使用自己的現有 ETL 或其他伺服器,也可以購買新伺服器。 如需詳細資訊,請參閱取得並設定載入伺服器。 這些指示包括載入伺服器容量規劃工作表,可協助您規劃正確的載入解決方案。
使用 dwloader 載入
使用 dwloader 命令列載入器是將資料載入到 PDW 的最快捷方式。
dwloader 直接將資料載入計算節點,而不經過控制節點。 若要載入資料,dwloader 會先與控制節點通訊,以獲得計算節點的連絡資訊。 dwloader 會設定與每個計算節點的通訊通道,然後以循環配置資源的方式將 256KB 的資料區塊傳送至計算節點。
在每個計算節點上,資料移動服務 (DMS) 接收並處理資料區塊。 處理資料包括將每個資料列轉換成 SQL Server 原生格式,以及計算散發雜湊,以確定每個資料列所屬的計算節點。
在處理資料列後,DMS 會透過隨機移動將每個資料列轉移至正確的計算節點與 SQL Server 執行個體。 當 SQL Server 接收資料列時,它會依據 dwloader 中設定的 -b 批次大小參數執行批次處理,然後大量載入批次。
使用已備妥陳述式載入
您可以使用已備妥陳述式,將資料載入至分散式資料表和複寫資料表中。 當輸入資料與目標資料類型不符時,則會執行隱含轉換。 PDW 已備妥陳述式支援的隱含轉換,是 SQL Server 所支援轉換的一個子集。 換言之,雖然只有一個轉換子集受支援,但支援的轉換與 SQL Server 隱含轉換相符。 不論要載入的目標資料表是否被定義為分散式或複寫資料表,隱含轉換會被套用至目標資料表中所有存在的資料行 (若有需要)。
相關工作
Task | 描述 |
---|---|
建立臨時資料庫。 | 建立臨時資料庫 |
使用 Integration Services 載入。 | 使用 Integration Services 載入 |
了解 dwloader 的類型轉換。 | dwloader 的資料類型轉換規則 |
使用 dwloader 載入資料。 | dwloader 命令列載入器 |
了解 INSERT 的類型轉換。 | 使用 INSERT 載入資料 |