파일에서 데이터 가져오기
데이터 수집은 하나 이상의 원본에서 Azure Data Explorer의 테이블로 데이터를 로드하는 데 사용되는 프로세스입니다. 수집한 데이터는 쿼리용으로 사용하실 수 있게 됩니다. 이 문서에서는 로컬 파일에서 새 테이블 또는 기존 테이블로 데이터를 가져오는 방법을 알아봅니다.
데이터 수집에 대한 일반적인 내용은 Azure Data Explorer 데이터 수집 개요를 참조하세요.
필수 조건
- Microsoft 계정 또는 Microsoft Entra 사용자 ID입니다. Azure 구독이 필요하지 않습니다.
- Azure Data Explorer 웹 UI에 로그인합니다.
- Azure Data Explorer 클러스터 및 데이터베이스. 클러스터 및 데이터베이스를 만듭니다.
데이터 가져오기
Source
데이터 가져오기 창에서 소스탭을 선택해 주세요.
사용 가능한 목록에서 데이터 원본을 선택합니다. 이 예제에서는 로컬 파일에서 데이터를 수집합니다.
참고 항목
수집 가능한 최대 파일 크기는 6GB입니다. 100MB에서 1GB 사이의 파일을 수집하는 것이 좋습니다.
구성
대상 데이터베이스 및 테이블을 선택합니다. 새로운 테이블로 데이터를 수집하고 싶으신 경우에 + 새로운 테이블 을 선택해 주시고 테이블 이름을 입력해 주세요.
참고 항목
테이블 이름은 공백, 영숫자, 하이픈 및 밑줄을 포함하여 최대 1,024자 까지 사용하실 수 있습니다. 특수 문자는 지원되지 않습니다.
파일을 창으로 끌거나 파일 찾아보기를 선택합니다.
참고 항목
최대 1,000개의 파일을 추가할 수 있습니다. 각 파일은 압축되지 않은 크기로 최대 1 GB일 수 있습니다.
다음을 선택합니다.
검사
검사 탭이 열려서 데이터는 미리 표시되는 것입니다.
수집 처리를 완료하기 위해서는 종료를 선택해 주세요.
필요할 경우 다음을 선택합니다.
- 입력에서 생성된 자동 명령을 보시고 복사하시기 위해서 명령 보기를 선택해 주세요.
- 스키마 정의 파일 드롭다운을 사용하셔서 스키마가 추론된 파일을 변경해 보세요.
- 드롭다운에서 원하시는 형식을 선택하셔서 자동으로 추론된 데이터 형식을 변경해 보세요. 수집을 위해 Azure Data Explorer에서 지원하는 데이터 형식을 참조 하세요.
- 열을 편집해 보세요.
- 데이터 형식에 따른 고급 옵션을 탐색합니다.
열을 편집해 보세요
참고 항목
- 테이블 형식 (CSV, TSV, PSV) 의 경우에 열을 두 번은 매핑하실 수 없습니다. 기존 열에 매핑하려면 먼저 새 열을 삭제합니다.
- 기존 열 유형은 변경할 수 없습니다. 다른 형식의 열에 매핑하려고 하면 빈 열이 생길 수 있습니다.
테이블에서 변경할 수 있는 사항은 다음 매개 변수에 따라 다릅니다.
- 테이블 유형은 신규 또는 기존입니다.
- 매핑 유형은 신규 또는 기존입니다.
테이블 유형입니다. | 매핑 유형 | 사용 가능한 조정 |
---|---|---|
새 테이블 | 새 매핑 | 열 이름 바꾸기, 데이터 형식 변경, 데이터 원본 변경, 매핑 변환, 열 추가, 열 삭제 |
기존 테이블 | 새 매핑 | 열 추가 (데이터 형식 변경, 이름 바꾸기 및 업데이트를 할 수 있음) |
기존 테이블 | 기존 매핑 | 없음 |
매핑 변환
일부 데이터 형식 매핑(Parquet, JSON 및 Avro)은 간단한 수집 시간 변환을 지원합니다. 매핑 변환을 적용하기 위해서는 열을 편집해 보세요창에서 열을 만들어 보시거나 업데이트 해보세요.
매핑 변환은 형식 문자열 혹은 날짜/시간 형식의 열에서 실행해 보실 수 있으며 소스의 데이터 형식이 int 혹은 long입니다. 지원되는 매핑 변환은 다음과 같습니다.
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
데이터 형식을 기반으로 한 고급 옵션
테이블 형식 (CSV, TSV, PSV):
기존 테이블에서 테이블 형식을 수집하는 경우 고급>유지 현재 테이블 스키마를 선택할 수 있습니다. 테이블 형식 데이터에는 원본 데이터를 기존 열에 매핑하는 데 사용되는 열 이름이 반드시 포함되지는 않습니다. 이 옵션을 선택하실 때 매핑은 순서대로 실행이 되며 테이블 스키마는 동일하게 유지됩니다. 이 옵션을 선택하지 않으시는 경우에 데이터 구조와는 상관없이 수신 데이터에 대한 새로운 열이 만들어 지게 됩니다.
첫 번째 행을 열 이름으로 사용하기 위해서는 고급>첫 번째 행을 열 머리글로 선택해 주세요.
JSON:
JSON 데이터의 열 분할을 확인하기 위해서는 1에서 100까지의 고급>중첩된 수준을 선택해 주세요.
고급>데이터 무시 데이터 형식 오류를 선택하면 데이터가 JSON 형식으로 수집됩니다. 이 확인란을 선택하지 않으신 상태로 두게 되시는 경우에 데이터가 multijson 형식으로 수집되어 집니다.
요약
데이터 준비 창에서 데이터 수집이 성공적으로 완료되셨을 때 세 단계 모두 녹색 확인 표시가 나타납니다. 각 단계에 사용된 명령을 보거나 수집된 데이터를 쿼리, 시각화 또는 삭제할 카드를 선택할 수 있습니다.