편집기로 Power Query 데이터 정리 및 변환

완료됨

바탕 화면 Microsoft Power BI 을 사용하여 데이터 원본에 연결했으므로 이제 요구 사항에 맞게 데이터를 조정해야 합니다. 경우에 따라 조정은 열 또는 테이블의 이름을 바꾸거나, 텍스트를 숫자로 변경하거나, 행을 제거하거나, 첫 번째 행을 머리글로 설정하는 등의 방법으로 데이터를 변환하는 것을 의미합니다 .

Power Query Editor in Power BI Desktop 은 리본에서 작업을 사용할 수 있을 뿐만 아니라 바로 가기 메뉴(오른쪽 클릭 또는 상황에 맞는 메뉴라고도 함)를 광범위하게 사용합니다. 리본의 변환 탭에서 선택할 수 있는 대부분의 항목은 항목(예: 열)을 마우스 오른쪽 단추로 클릭한 다음 표시되는 바로 가기 메뉴에서 명령을 선택하여 사용할 수도 있습니다.

데이터 형성

에디터 에서 데이터를 셰이핑 Power Query 할때 데이터를 로드하고 표시할 때 데이터를 조정하기 위해 에디터 Power Query 에서 수행하는 단계별 안내 를 제공하게 됩니다. 원래 데이터 원본은 영향을 받지 않습니다. 이 특정 데이터 보기만 조정되거나 셰이핑됩니다.

지정한 단계(예: 테이블 이름 바꾸기, 데이터 유형 변환 또는 열 삭제)는 편집기 Power Query 에기록됩니다. 그런 다음 쿼리가 데이터 원본에 연결될 때마다 이러한 단계가 수행되므로 데이터는 항상 지정한 방식으로 셰이핑됩니다. 이 프로세스는 에서 Power BI Desktop 쿼리를 사용할 때마다 또는 다른 사람이 공유 쿼리를 사용할 때마다(예: 서비스 Power BI 에서) 발생합니다. 단계는 설정 창의 적용된 단계에서 Power Query 순차적으로 캡처됩니다.

다음 이미지는 셰이핑된 쿼리에 대한 쿼리 설정 창을 보여 줍니다. 다음 몇 단락에서 각 단계를 살펴보겠습니다.

쿼리 설정

데이터 원본에 연결하여 찾은 사용 중지 데이터로 돌아가서 요구 사항에 맞게 데이터를 셰이핑해 보겠습니다.

메모

샘플 데이터 세트를 다운로드하지 않은 경우 이전 학습활동 페이지를 참조하십시오.

데이터는 숫자여야 합니다. 이 경우에는 괜찮지만 데이터 형식을 변경해야 하는 경우 열 머리글을 마우스 오른쪽 단추로 클릭한 다음 형식 정수 변경 > 을 선택합니다. 두 개 이상의 열을 변경해야 하는 경우 그 중 하나를 선택한 다음 Shift 키를 누른 상태에서 인접한 열을 추가로 선택합니다. 그런 다음 열 머리글을 마우스 오른쪽 단추로 클릭하여 선택한 모든 열을 변경합니다. Ctrl 키를 사용하여 인접하지 않은 열을 선택할 수도 있습니다.

적용된 단계 변경 유형

메모

종종 Power Query 텍스트 열이 숫자여야 함을 감지하고 표를 편집기로 Power Query 가져올 때 데이터 유형을 자동으로 변경합니다. 이 경우 적용된 단계 아래의 단계는 사용자에게 수행된 작업을 Power Query 식별합니다.

리본 메뉴의 변환 탭을 사용하여 이러한 열을 텍스트에서 머리글로 변경하거나 변환할 수도 있습니다. 다음 이미지는 변환 탭을 보여 줍니다 . 빨간색 상자는 현재 데이터 형식을 다른 데이터 형식으로 변환할 수 있는 데이터 형식 버튼을 강조 표시합니다 .

변환 리본 및 데이터 형식 버튼

쿼리 설정 창의 적용된 단계 목록에는 모든 변경 내용이 반영됩니다. 셰이핑 프로세스에서 단계 제거하려면 선택한 다음 왼쪽에 있는 X 를 선택하면 됩니다.

쿼리 설정 창

데이터에 연결

다양한 상태에 대한 데이터는 흥미롭고 추가 분석 작업 및 쿼리를 작성하는 데 유용합니다. 그러나 한 가지 문제가 있습니다 : 대부분의 데이터는 주 코드에 대해 주 전체 이름이 아닌 두 글자 약어를 사용합니다. 따라서 주 이름을 약어와 연결할 수 있는 방법이 필요합니다.

운이 좋게도 이를 수행하는 또 다른 공개 데이터 원본이 있지만 은퇴 테이블에 연결하기 전에 상당한 양의 셰이핑이 필요합니다. 상태 약어에 대한 웹 리소스는 다음과 같습니다.

http://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations

편집기의 Power Query 리본 메뉴에있는 홈 탭에서 새 원본 웹을 선택합니다 . > 그런 다음 주소를 입력하고 확인을 선택합니다 . 탐색기 창에는 해당 웹 페이지에서 찾은 내용이 표시됩니다.

웹 사이트의 미국 주 약어

코드 및 약어 선택... 테이블에는 우리가 원하는 데이터가 포함되어 있기 때문에 해당 데이터를 압축하려면 상당한 셰이핑이 필요합니다.

로드를 선택하여 데이터를 에디터Power Query 가져와 셰이핑할 수 있습니다. 그런 다음 다음 단계를 따라와 수행합니다.

  • 상위 3개 행 제거– 이러한 행은 웹 페이지의 테이블이 생성된 방식의 결과이며 필요하지 않습니다. 행을 제거하려면 리본의 홈 탭에서 행 제거, 상위 행 제거를 선택합니다 > . 표시되는 대화 상자에서 제거할 행 수로 3 을 입력합니다 .

    상위 행 제거

  • 아래쪽 26개 행 제거 – 이 행은 모두 지역에 대한 것이므로 포함할 필요가 없습니다. 프로세스는 동일하지만 이번에는 행 제거 하위 행 제거를 > 선택하고제거할 행 수로 26 을 입력합니다 .

    아래쪽 행 제거

  • 워싱턴 DC 필터링– 은퇴 통계 테이블에는 워싱턴 DC가 포함되어 있지 않으므로 목록에서 제외합니다. Federal state 열 옆에 있는 드롭다운 화살표를 선택한 다음 Federal district 확인란의 선택을 취소 합니다.

    특정 값을 가진 행 제거

  • 불필요한 열 몇 개 제거– 각 주를 공식 두 글자 약어에 매핑하기만 하면 되며 해당 정보는 첫 번째 열과 네 번째 열에 제공됩니다. 따라서 이 두 열만 유지하면 다른 모든 열을 제거할 수 있습니다. 제거할 첫 번째 열을 선택한 다음 Ctrl 키를 누른 상태에서 제거할 다른 열을 선택합니다(이렇게 하면 인접하지 않은 여러 열을 선택할 수 있음). 그런 다음 리본의 탭에서 열 제거, 열 제거를 > 선택합니다.

    특정 열 제거

  • 첫 번째 행을 머리글로 사용 – 상위 3개 행을 제거했기 때문에 현재 맨 위 행이 원하는 머리글입니다. 첫 번째 행을 머리글로 사용버튼을 선택합니다 .

    첫 번째 행을 머리글로 사용

    메모

    에디터 에서 적용된 단계 의 순서 Power Query 가 중요하며 데이터가 형성되는 방식에 영향을 줄 수 있다는 점을 가리키다 보는 것이 좋습니다. 한 단계가 다른 후속 단계에 어떤 영향을 미칠 수 있는지 고려하는 것도 중요합니다. 적용된 단계 목록에서 단계 를 제거하면 쿼리 단계 시퀀스의 영향으로 인해 후속 단계가 원래 의도한 대로 작동하지 않을 수 있습니다.

  • 열 및 테이블 자체 이름 바꾸기– 평소와 같이 열 이름을 바꾸는 몇 가지 방법이 있습니다. 원하는 방법을 사용할 수 있습니다. 이름을 State Name State Code 로 바꿔 보겠습니다. 테이블 이름을 바꾸려면 쿼리 설정 창의 이름 필드에 이름을 입력하기만 하면 됩니다 . 이 테이블을 StateCodes라고 부르겠습니다.

    열 이름 바꾸기

데이터 결합

이제 StateCodes 테이블의 모양이 만들어졌으므로 두 테이블을 하나로 결합할 수 있습니다. 현재 있는 테이블은 데이터에 적용한 쿼리의 결과이기 때문에 종종 쿼리 라고합니다.

쿼리를 결합하는 두 가지 기본 방법은 병합추가입니다.

다른 쿼리 에 추가하려는 열이 하나 이상 있는 경우 쿼리를 병합 합니다. 기존 쿼리에 추가할 추가 데이터 행이 있는 경우 쿼리를 추가합니다 .

이 경우 쿼리를 병합하려고 합니다. 시작하려면 다른 쿼리를 병합할 쿼리를 선택합니다. 그런 다음 리본의 탭에서 쿼리 병합을 선택합니다 . 먼저 은퇴 쿼리를 선택하려고 합니다. 이 작업을 수행하는 동안 해당 쿼리 의 이름을 RetirementStats로 바꿔 보겠습니다.

쿼리 병합 버튼

병합 대화 상자가 나타나고 선택한 테이블에 병합할 테이블과 병합에 사용할 일치하는 열을 선택하라는 메시지가 표시됩니다.

RetirementStats 테이블(쿼리)에서 State 를 선택한 다음 StateCodes 쿼리를 선택합니다 . (이 경우 다른 쿼리가 하나뿐이므로 선택이 쉽습니다. 그러나 많은 데이터 원본에 연결하면 선택할 수 있는 쿼리가 많아집니다. RetirementStats의 StateStateCodesState Name 같이 일치하는 올바른 열을 선택하면 병합 대화 상자가 다음과 같이 표시되고 확인 버튼을 사용할 수 있게 됩니다.

병합 대화 상자

NewColumn 은 쿼리가 끝날 때 만들어지며 기존 쿼리와 병합된 테이블(쿼리)의 내용입니다. 병합된 쿼리의 모든 열은 NewColumn 으로압축되지만 테이블을 확장 하고 원하는 열을 포함할 수 있습니다. 병합된 테이블을 확장하고 포함할 열을 선택하려면 확장 아이콘(확장 아이콘)을 선택합니다. 확장 대화 상자가 나타납니다.

확장 대화 상자

이 경우 State Code 열만 필요합니다 . 따라서 해당 열만 선택한 다음 확인을 선택합니다. 원래 열 이름을 접두사 로 사용 확인란의 선택을 취소할 수도 있습니다. 이 옵션을 선택한 상태로 두면 병합된 열의 이름이 NewColumn.State Code (원래 열 이름, NewColumn, 점, 쿼리로 가져올 열 이름)가 됩니다.

메모

원하는 경우 NewColumn 테이블을 가져오는 방법을 시험해 볼 수 있습니다. 결과가 마음에 들지 않으면 쿼리 설정 창의 적용된 단계 목록에서 확장 단계 를 삭제하면 됩니다 . 쿼리는 해당 단계를 적용하기 전의 상태로 돌아갑니다. 확장 프로세스가 원하는 대로 보일 때까지 원하는 만큼 여러 번 수행할 수 있는 무료 반복과 같습니다.

이제 두 개의 데이터 원본을 결합하는 단일 쿼리(테이블)가 있으며, 각 데이터 원본은 요구 사항에 맞게 셰이핑되었습니다. 이 쿼리는 모든 주의 주택 비용 통계, 인구 통계 또는 취업 기회와 같은 많은 흥미로운 추가 데이터 연결의 기초 역할을 할 수 있습니다.

편집기에서 Power Query 변경 사항을 적용하고 로드 하려면 리본의 홈 Power BI Desktop탭에서 닫기 및 적용 선택합니다 .

데이터 설정 닫기 및 적용

이제 모델의 데이터를 사용할 준비가 되었습니다. 다음으로 보고서에 대한 몇 가지 시각적 개체를 만듭니다.

현재로서는 몇 가지 흥미로운 보고서를 Power BI Desktop 만들 수 있는 충분한 데이터가 있습니다. 이것은 이정표이므로 이 Power BI Desktop 파일을 저장해 보겠습니다. 리본의 홈 탭에서 파일 > 저장 을 선택하여 보고서를 저장합니다(시작이라고 함 Power BI Desktop).

대! 이제 다음 단원으로 넘어가서 몇 가지 흥미로운 시각적 개체를 만들어 보겠습니다.