ORC 對應
適用於: ✅Microsoft網狀架構✅Azure 數據總管
當您擷取來源檔案為 ORC 格式時,使用 ORC 對應將傳入數據對應至數據表內的數據行。
對應清單中的每個元素都會定義特定數據行的對應。 這些元素是從三個屬性建構的: column
、 datatype
和 properties
。 深入了解 數據對應概觀。
每個 ORC 對應項目都必須包含下列任一選擇性屬性:
屬性 | 類型 | 描述 |
---|---|---|
欄位 | string |
ORC 記錄中的功能變數名稱。 |
路徑 | string |
如果值以它開頭 $ ,它會解譯為 ORC 檔中欄位的路徑,而該欄位將成為數據表中數據行的內容。 表示整個 ORC 記錄的路徑為 $ 。 如果值不是以 $ 該值開頭,則會解譯為常數值。 包含特殊字元的路徑應該逸出為 ['Property Name']。 如需詳細資訊,請參閱 JSONPath 語法。 |
ConstValue | string |
要用於數據行的常數值,而不是 ORC 檔案中的某些值。 |
轉換 | string |
應該套用到具有 對應轉換之內容上的轉換。 |
注意
欄位和路徑互斥。
下列替代方式是相等的:
[
{"Column": "event_name", "Properties": {"Path": "$.EventName"}}
]
[
{"Column": "event_name", "Properties": {"Field": "EventName"}}
]
重要
針對佇列擷取:
- 如果對應中所參考的數據表不存在於資料庫中,就會自動建立該數據表,因為會針對所有數據行指定有效的數據類型。
- 如果對應中所參考的數據行不存在於數據表中,它會在第一次為該數據行內嵌數據時自動加入數據表,因為數據行指定了有效的數據類型。 若要將新的數據行新增至對應,請使用 .alter 擷取對應命令。
- 數據會使用擷取屬性進行批處理。 使用愈不同的擷取對應屬性,例如不同的 ConstValue 值,擷取會變成越分散,這可能會導致效能降低。
範例
[
{"Column": "event_timestamp", "Properties": {"Path": "$.Timestamp"}},
{"Column": "event_name", "Properties": {"Path": "$.Event.Name"}},
{"Column": "event_type", "Properties": {"Path": "$.Event.Type"}},
{"Column": "event_time", "Properties": {"Path": "$.Timestamp", "Transform": "DateTimeFromUnixMilliseconds"}},
{"Column": "ingestion_time", "Properties": {"ConstValue": "2021-01-01T10:32:00"}},
{"Column": "full_record", "Properties": {"Path": "$"}}
]
當上述對應作為管理命令的 .ingest
一部分提供時,會串行化為 JSON 字串。
.ingest into Table123 (@"source1", @"source2")
with
(
format = "orc",
ingestionMapping =
```
[
{"Column": "column_a", "Properties": {"Path": "$.Field1"}},
{"Column": "column_b", "Properties": {"Path": "$.[\'Field name with space\']"}}
]
```
)
預先建立的對應
預先建立對應時,請在管理命令中.ingest
依名稱參考對應。
.ingest into Table123 (@"source1", @"source2")
with
(
format="orc",
ingestionMappingReference = "ORC_Mapping"
)
身分識別對應
在擷取期間使用 ORC 對應而不定義對應架構(請參閱 身分識別對應)。
.ingest into Table123 (@"source1", @"source2")
with
(
format="orc"
)