연습: 처음으로 데이터 살펴보기
이 시나리오에서는 미국의 폭풍에 대한 기상 정보가 포함된 새로운 데이터 세트를 살펴보았습니다. 이 단원에서는 데이터 자체를 처음으로 살펴보겠습니다.
원시 데이터 살펴보기
가장 먼저 할 일은 실제 데이터를 살펴보고 어떤 열이 있는지, 이러한 열에 어떤 데이터 형식이 들어 있는지, 가능한 값은 무엇인지 알아보는 것입니다. 데이터 테이블의 모든 줄을 볼 필요는 없으므로 전체 테이블 중 일부만 선택하겠습니다.
다음 쿼리를 실행하여 임의의 데이터 행 50개를 가져옵니다.
StormEvents | take 50
특정 줄이 약간 다를 수 있지만 다음 이미지와 비슷한 결과를 얻게 됩니다.
아래 쿼리에서 결과 표라고 하는 결과 테이블을 살펴봅니다. 오른쪽으로 스크롤하여 모든 열을 살펴봅니다. 열의 데이터 형식과 값 범위를 파악할 수 있겠습니까? 표시된 필드는 전체 테이블의 샘플링일 뿐입니다.
결과 표를 사용하여 데이터 재구성
결과 표는 다른 환경에서도 익숙한 여러 가지 기본 도구를 제공합니다. 예를 들어 특정 열을 기준으로 데이터를 정렬할 수 있습니다.
다음 예제는 take 50
쿼리의 결과로 시작합니다.
열의 데이터 정렬
특정 열을 정렬하려면 결과 표에서 해당 열의 이름을 선택합니다. 열 이름 오른쪽에 표시되는 화살표는 오름차순으로 정렬되었는지 아니면 내림차순으로 정렬되었는지 나타냅니다.
상태 열을 선택합니다.
결과 목록을 살펴봅니다. 여러 행에 표시되는 상태가 있나요? 위에서 선택한 50개 행을 보고 있으므로 전체 목록이 표시되지 않습니다.
결과 그룹화
데이터를 한 단계 더 정렬하면 일반적인 필드를 기준으로 결과를 그룹화하거나 집계할 수 있습니다. 위의 정렬된 목록은 다양한 상태에 대한 여러 가지 항목을 제공했습니다.
- 정렬할 열의 오른쪽에서 메뉴 아이콘을 선택합니다. 이 예제에서는 상태 열의 오른쪽에서 메뉴를 선택합니다.
- 상태별 그룹화를 선택합니다.
- 각 상태 뒤에는 연결된 항목 수가 표시됩니다. 상태 이름 왼쪽에 있는 화살표를 선택하면 이러한 항목이 확장됩니다.
데이터 하위 집합 선택
테이블에 어떤 종류의 데이터가 있는지 파악했으므로, 해당 데이터의 하위 집합(예: 홍수 이벤트)을 선택할 수 있습니다.
- EventType 열에서 필터링하려는 이벤트를 선택합니다. 키보드의 Shift 키를 누른 채로 돌발 홍수, 폭우, 홍수와 같은 여러 이벤트를 선택합니다.
- 선택한 필드를 마우스 오른쪽 단추로 클릭하고 선택 항목을 필터로 추가를 선택합니다. 앞의 쿼리는 필터링된 필드를 추가하도록 변경됩니다.
- 실행 단추를 선택하여 쿼리를 다시 실행합니다. 모든 결과 이벤트는 이제 선택한 형식 중 하나입니다.
값 필터링
단일 값을 필터링할 수도 있습니다. 오하이오주에서 일어난 모든 이벤트를 살펴보겠습니다.
상태 열 오른쪽에 있는 메뉴 아이콘을 선택합니다.
깔때기 아이콘을 선택합니다.
모든 형식의 문자열 또는 정수 일치 항목을 검색할 수 있지만, 우리가 찾으려는 것은 오하이오라는 단어가 포함된 열입니다. 이 필터를 사용하여 불완전하거나 빈 데이터 필드를 찾을 수도 있습니다.
필터링 유형 아래에서 오하이오라는 단어를 입력합니다. 결과가 즉시 필터링됩니다.
선택한 셀 요약
결과 표의 오른쪽 아래 모서리에 선택한 셀이 요약되어 있습니다. 정수 값을 선택하면 이러한 값의 통계 요약 정보도 볼 수 있습니다.
결과 표를 스크롤하여 DamageProperty 열을 찾습니다.
이 열의 셀 선택 영역을 클릭하여 끌어옵니다. 셀이 선택되었다는 것을 나타나기 위해 셀의 배경이 파란색으로 강조 표시됩니다.
결과 표의 오른쪽 아래 모서리를 살펴봅니다. 표시되는 최댓값과 최솟값은 얼마인가요? 이 요약 정보가 이 열의 데이터 범위를 이해하는 데 도움이 되나요?
동적 필드 확장
데이터 테이블의 마지막 열로 스크롤합니다. StormSummary 열이 보이나요? 이 필드에는 많은 양의 데이터가 있으며 일부 데이터는 보이지 않습니다. 셀을 확장하면 동적 필드 내의 모든 정보를 볼 수 있습니다.
결과 표의 오른쪽 위에서 보기 확장 아이콘을 선택합니다.
오른쪽을 선택하여 확장된 결과를 오른쪽 창에 표시합니다.
테이블 맨 오른쪽으로 스크롤하여 StormSummary 열을 찾습니다.
이 열의 필드 중 하나를 두 번 클릭합니다. 그러면 필드가 확장되고 필드 내용이 읽기 쉬운 형식으로 표시됩니다.