다음을 통해 공유


파일에서 데이터 가져오기

데이터 수집은 하나 이상의 원본에서 Azure Data Explorer의 테이블로 데이터를 로드하는 데 사용되는 프로세스입니다. 수집한 데이터는 쿼리용으로 사용하실 수 있게 됩니다. 이 문서에서는 로컬 파일에서 새 테이블 또는 기존 테이블로 데이터를 가져오는 방법을 알아봅니다.

데이터 수집에 대한 일반적인 내용은 Azure Data Explorer 데이터 수집 개요를 참조하세요.

필수 조건

  • Microsoft 계정 또는 Microsoft Entra 사용자 ID입니다. Azure 구독이 필요하지 않습니다.
  • Azure Data Explorer 웹 UI에 로그인합니다.
  • Azure Data Explorer 클러스터 및 데이터베이스. 클러스터 및 데이터베이스를 만듭니다.

데이터 가져오기

  1. 왼쪽 메뉴에서 쿼리를 선택합니다.

  2. 데이터를 수집할 데이터베이스를 마우스 오른쪽 단추로 클릭합니다. 데이터 가져오기를 선택합니다.

    데이터베이스를 마우스 오른쪽 단추로 클릭하고 옵션 가져오기 대화 상자가 열려 있는 쿼리 탭의 스크린샷

Source

데이터 가져오기 창에서 소스탭을 선택해 주세요.

사용 가능한 목록에서 데이터 원본을 선택합니다. 이 예제에서는 로컬 파일에서 데이터를 수집합니다.

소스 탭이 선택된 데이터 가져오기 창 스크린샷입니다.

참고 항목

수집 가능한 최대 파일 크기는 6GB입니다. 100MB에서 1GB 사이의 파일을 수집하는 것이 좋습니다.

구성

  1. 대상 데이터베이스 및 테이블을 선택합니다. 새로운 테이블로 데이터를 수집하고 싶으신 경우에 + 새로운 테이블 을 선택해 주시고 테이블 이름을 입력해 주세요.

    참고 항목

    테이블 이름은 공백, 영숫자, 하이픈 및 밑줄을 포함하여 최대 1,024자 까지 사용하실 수 있습니다. 특수 문자는 지원되지 않습니다.

  2. 파일을 창으로 끌거나 파일 찾아보기를 선택합니다.

    참고 항목

    최대 1,000개의 파일을 추가할 수 있습니다. 각 파일은 압축되지 않은 크기로 최대 1 GB일 수 있습니다.

    새로운 테이블이 입력이 되셔서 하나의 샘플 데이터 파일이 선택된 구성 탭의 스크린샷입니다.

  3. 다음을 선택합니다.

검사

검사 탭이 열려서 데이터는 미리 표시되는 것입니다.

수집 처리를 완료하기 위해서는 종료를 선택해 주세요.

검사 탭의 스크린샷입니다.

필요할 경우 다음을 선택합니다.

  • 입력에서 생성된 자동 명령을 보시고 복사하시기 위해서 명령 보기를 선택해 주세요.
  • 스키마 정의 파일 드롭다운을 사용하셔서 스키마가 추론된 파일을 변경해 보세요.
  • 드롭다운에서 원하시는 형식을 선택하셔서 자동으로 추론된 데이터 형식을 변경해 보세요. 수집을 위해 Azure Data Explorer에서 지원하는 데이터 형식을 참조 하세요.
  • 열을 편집해 보세요.
  • 데이터 형식에 따른 고급 옵션을 탐색합니다.

열을 편집해 보세요

참고 항목

  • 테이블 형식 (CSV, TSV, PSV) 의 경우에 열을 두 번은 매핑하실 수 없습니다. 기존 열에 매핑하려면 먼저 새 열을 삭제합니다.
  • 기존 열 유형은 변경할 수 없습니다. 다른 형식의 열에 매핑하려고 하면 빈 열이 생길 수 있습니다.

테이블에서 변경할 수 있는 사항은 다음 매개 변수에 따라 다릅니다.

  • 테이블 유형은 신규 또는 기존입니다.
  • 매핑 유형은 신규 또는 기존입니다.
테이블 유형입니다. 매핑 유형 사용 가능한 조정
새 테이블 새 매핑 열 이름 바꾸기, 데이터 형식 변경, 데이터 원본 변경, 매핑 변환, 열 추가, 열 삭제
기존 테이블 새 매핑 열 추가 (데이터 형식 변경, 이름 바꾸기 및 업데이트를 할 수 있음)
기존 테이블 기존 매핑 없음

편집을 할 수 있게 하기 위해 열린 열의 스크린샷입니다.

매핑 변환

일부 데이터 형식 매핑(Parquet, JSON 및 Avro)은 간단한 수집 시간 변환을 지원합니다. 매핑 변환을 적용하기 위해서는 열을 편집해 보세요창에서 열을 만들어 보시거나 업데이트 해보세요.

매핑 변환은 형식 문자열 혹은 날짜/시간 형식의 열에서 실행해 보실 수 있으며 소스의 데이터 형식이 int 혹은 long입니다. 지원되는 매핑 변환은 다음과 같습니다.

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

데이터 형식을 기반으로 한 고급 옵션

테이블 형식 (CSV, TSV, PSV):

  • 기존 테이블에서 테이블 형식을 수집하는 경우 고급>유지 현재 테이블 스키마를 선택할 수 있습니다. 테이블 형식 데이터에는 원본 데이터를 기존 열에 매핑하는 데 사용되는 열 이름이 반드시 포함되지는 않습니다. 이 옵션을 선택하실 때 매핑은 순서대로 실행이 되며 테이블 스키마는 동일하게 유지됩니다. 이 옵션을 선택하지 않으시는 경우에 데이터 구조와는 상관없이 수신 데이터에 대한 새로운 열이 만들어 지게 됩니다.

  • 첫 번째 행을 열 이름으로 사용하기 위해서는 고급>첫 번째 행을 열 머리글로 선택해 주세요.

    고급 CSV 옵션 스크린샷입니다.

JSON:

  • JSON 데이터의 열 분할을 확인하기 위해서는 1에서 100까지의 고급>중첩된 수준을 선택해 주세요.

  • 고급>데이터 무시 데이터 형식 오류를 선택하면 데이터가 JSON 형식으로 수집됩니다. 이 확인란을 선택하지 않으신 상태로 두게 되시는 경우에 데이터가 multijson 형식으로 수집되어 집니다.

    고급 JSON 옵션의 스크린샷.

요약

데이터 준비 창에서 데이터 수집이 성공적으로 완료되셨을 때 세 단계 모두 녹색 확인 표시가 나타납니다. 각 단계에 사용된 명령을 보거나 수집된 데이터를 쿼리, 시각화 또는 삭제할 카드를 선택할 수 있습니다.

요약 페이지에 대한 스크린샷과 수집은 성공적으로 완료됐습니다.