초기 데이터 모양 지정

완료됨

Power BI Desktop의 Power Query 편집기를 사용하면 가져온 데이터의 모양을 지정(변환)할 수 있습니다. 열 또는 테이블 이름 바꾸기, 텍스트를 숫자로 변경, 행 제거, 첫 번째 행을 머리글로 설정 등의 작업이 가능합니다. 데이터는 사용자의 요구 사항을 충족하며 보고서에서 사용하기에 적합하도록 모양을 지정해야 합니다.

두 원본의 원시 매출 데이터를 Power BI 모델에 로드했습니다.  일부 데이터는 영업 팀이 Microsoft Excel에서 직접 제작한 .csv 파일에서 가져왔습니다.  다른 데이터는 조직의 ERP(Enterprise Resource Planning) 시스템에 연결하여 로드했습니다.  이제 Power BI Desktop의 데이터를 살펴보면 뒤죽박죽이라는 사실을 알 수 있습니다. 필요 없는 데이터도 있고 필요하지만 형식이 올바르지 않은 데이터도 있습니다.

보고서 작성을 시작하려면 먼저 Power Query 편집기를 사용하여 이 데이터를 정리하고 모양을 지정해야 합니다.

Power Query 편집기 시작하기

데이터 셰이핑을 시작하려면 Power BI Desktop의 탭에서 데이터 변환 옵션을 선택하여 Power Query 편집기를 엽니다.

Power Query 편집기에서는 화면 중간에는 선택된 쿼리 내의 데이터가 표시되고 왼쪽에는 쿼리 창에 사용 가능한 쿼리(테이블)가 나열됩니다.

Power Query 편집기에서 작업할 때는 데이터 모양 지정을 위해 수행하는 모든 단계가 기록됩니다. 이후에는 쿼리가 데이터 원본에 연결될 때마다 자동으로 단계를 적용하기 때문에 데이터는 항상 사용자가 지정한 방식으로 모양이 지정됩니다.  Power Query 편집기는 데이터의 특정 보기만 변경하므로 원래 데이터 원본에 적용되는 변경 사항을 확신할 수 있습니다. 화면 오른쪽의 쿼리 설정 창에는 단계 목록과 쿼리 속성이 표시됩니다.

Power Query 편집기 리본에는 데이터를 선택하고, 확인하고, 모양을 지정할 수 있는 다양한 단추가 있습니다.

사용 가능한 기능 및 함수에 관한 자세한 내용은 쿼리 리본을 참조하세요.

참고

Power Query 편집기에서 상황에 맞는 메뉴와 리본의 변환 탭을 마우스 오른쪽 단추로 클릭하면 동일한 옵션 상당수를 사용할 수 있습니다.

열 머리글 및 이름 식별

초기 데이터의 모양을 지정하는 첫 번째 단계는 데이터 내에서 열 머리글 및 이름을 식별한 다음 올바른 위치에 있는지 확인하는 것입니다.

다음 스크린샷에서 SalesTarget(샘플이 제공되지 않음)에 대한 csv 파일의 소스 데이터에는 제품별로 분류된 대상과 월별로 분류된 하위 범주가 있으며, 두 항목 모두 다양한 열로 구성됩니다.

하지만 데이터를 정상적으로 가져오지 못했음을 알 수 있습니다.

그 결과 데이터를 읽기가 쉽지 않습니다. 열 머리글이 (빨간색으로 표시한) 다른 행에 있으며 여러 행이 Column1, Column2 같은 내용을 설명하지 않는 이름을 사용하기 때문에 현 상태에서는 데이터에 문제가 발생합니다.

열 머리글과 이름의 위치를 식별한다면 데이터를 변경해 재구성할 수 있습니다.

머리글 수준 올리기

Power BI Desktop에서 테이블을 만들 때 Power Query 편집기는 모든 데이터가 테이블 행에 속한다고 가정합니다. 그러나 일부 데이터 원본에는 열 이름을 포함하는 첫 번째 행이 있는데, 이전 SalesTarget 예제가 바로 이런 경우입니다.  이 오류를 수정하려면 첫 번째 테이블 행의 수준을 올려 열 머리글로 만들어야 합니다.

머리글은 두 가지 방법으로 수준을 올릴 수 있습니다. 탭에서 첫 번째 행을 머리글로 사용 옵션을 선택하거나 Column1 옆에 있는 드롭다운 단추를 선택한 다음, 첫 번째 행을 머리글로 사용을 선택하는 것입니다.

다음 이미지에서는 첫 번째 행을 머리글로 사용 기능이 데이터에 어떤 영향을 주는지 확인할 수 있습니다.

열 이름 바꾸기

데이터의 모양을 지정하는 다음 단계는 열 머리글을 검사하는 것입니다. 하나 이상의 열에 잘못된 머리글이 있거나, 머리글의 철자가 잘못되었거나, 머리글 명명 규칙이 일관적이지 않거나 사용자 친화적이지 않을 수 있습니다.

첫 번째 행을 머리글로 사용 기능의 영향을 보여주는 앞의 스크린샷을 참조하세요. 하위 범주 이름 데이터를 포함하는 열의 열 머리글이 임을 알 수 있습니다. 이 열 머리글은 올바르지 않으므로 이름을 바꿔야 합니다.

열 머리글의 이름은 두 가지 방법으로 바꿀 수 있습니다. 하나는 머리글을 마우스 오른쪽 단추로 클릭하고 이름 바꾸기를 선택하여 이름을 편집한 다음, Enter 키를 누르는 것입니다. 다른 방법은 열 머리글을 두 번 클릭하고 올바른 이름을 덮어쓰는 것입니다.

처음 두 행을 제거(건너뛰기)한 다음 열 이름을 올바른 이름으로 변경하여 문제를 해결하는 방법도 있습니다.

상위 행 제거

데이터의 모양을 지정할 때 공백이 있거나 보고서에서 필요 없는 데이터를 포함하는 행 같은 일부 상위 행을 제거해야 할 수도 있습니다.

SalesTarget 예제를 계속 진행하면, 첫 번째 행이 공백이며(데이터 없음) 두 번째 행에는 필요 없는 데이터가 있음을 알 수 있습니다.

이러한 잉여 행을 제거하려면 탭에서행 제거>상위 행 제거를 선택해야 합니다.

열 제거

데이터 모양 지정 프로세스의 핵심 단계는 불필요한 열을 제거하는 것입니다.  열은 최대한 빨리 제거해야 합니다. 열을 제거하는 한 가지 방법은 데이터 원본에서 데이터를 가져올 때 열을 제한하는 것입니다. 예를 들어 SQL을 사용하여 관계형 데이터베이스에서 데이터를 추출할 때는 SELECT 문의 열 목록을 사용하여 추출하는 열을 제한할 수 있습니다.

특히 테이블 간의 관계를 설정했다면 열을 프로세스의 초기 단계에서 제거하는 것이 훨씬 좋습니다. 불필요한 열을 제거하면 필요한 데이터에 집중하고 Power BI Desktop 의미 체계 모델 및 보고서의 전반적인 성능을 개선할 수 있습니다.

각 열을 검토하고 열에 있는 데이터가 정말로 필요한지 자문해 보세요. 보고서에서 사용하지 않을 데이터라면 열은 의미 체계 모델에 값을 추가하지 않습니다. 따라서 열을 제거해야 합니다.  시간이 지나 요구사항이 변경되면 나중에 열을 추가할 수 있습니다.

열은 두 가지 방법으로 제거할 수 있습니다. 첫 번째 방법은 제거할 열을 선택하고 탭에서 열 제거를 선택하는 것입니다.

다른 방법은 유지할 열을 선택하고 탭에서 열 제거>다른 열 제거를 선택하는 것입니다.

열 피벗 해제

피벗 해제는 Power BI가 제공하는 유용한 기능입니다. 이 기능은 어떤 데이터 원본의 데이터에도 사용할 수 있지만 일반적으로는 Excel에서 데이터를 가져올 때 사용합니다. 다음 예에서는 판매 데이터가 포함된 샘플 Excel 문서가 나옵니다.

데이터는 처음에는 적합할 수 있지만 2018년과 2019년의 데이터를 결합한 총 판매액을 만들기가 어려울 것입니다. 따라서 목표는 다음 세 개의 열을 이용해 Power BI에서 이 데이터를 사용하는 것입니다. 해당 열은 Month, YearSalesAmount입니다.

데이터를 파워 쿼리로 가져올 때는 다음 이미지와 비슷한 화면이 표시됩니다.

그런 다음 첫 번째 열의 이름을 Month로 바꿉니다. Excel의 머리글이 2018 및 2019 열을 레이블 지정하기 때문에 이 열은 레이블이 올바르지 않습니다. 2018 및 2019 열을 선택하고 파워 쿼리에서 변환 탭을 선택한 다음 피벗 해제를 선택합니다.

Attribute 열의 이름을 Year로 바꾸고 Value 열을 SalesAmount로 바꿀 수 있습니다.

피벗 해제를 이용하면 나중에 데이터에 대한 DAX 측정값을 만드는 프로세스를 간소화할 수 있습니다. 이 프로세스를 끝낸 덕분에 이제 YearMonth 열을 이용하여 데이터를 더 쉽게 슬라이스할 수 있습니다.

열 피벗

모양을 지정하는 데이터가 플랫 데이터라면(즉 세부 정보가 많지가 어떤 식으로도 조직화 또는 그룹화되지 않았다면) 부실한 구조 때문에 데이터의 패턴을 식별하기가 어려울 수 있습니다.

열 피벗 기능을 사용하면 플랫 데이터를 열의 각 고유 값에 대한 집계 값을 포함하는 테이블로 변환할 수 있습니다. 예를 들어 이 기능을 사용하면 Count, Minimum, Maximum, Median, Average 또는 Sum 같은 다양한 수학 함수를 사용하여 데이터를 요약할 수 있습니다.

SalesTarget 예제에서 열을 피벗하면 각 제품 범주의 제품 하위 범주 수량을 가져올 수 있습니다.

변환 탭에서 변환 > 열 피벗을 선택합니다.

표시되는 열 피벗 창의 값 열 목록에서 하위 범주 이름과 같은 열을 선택합니다. 고급 옵션을 확장하고 집계 값 함수 목록에서 개수(전체 항목) 같은 옵션을 선택한 다음, 확인을 선택합니다.

아래 이미지에서는 열 피벗 기능이 데이터 구성을 어떻게 바꾸는지 확인할 수 있습니다.

Power Query 편집기는 데이터 셰이핑을 위해 수행한 모든 단계를 기록하며, 단계 목록은 쿼리 설정 창에 표시됩니다. 필요한 변경 사항을 모두 적용했다면 닫기 & 적용을 선택하여 Power Query 편집기를 닫고 의미 체계 모델에 변경 사항을 적용합니다. 하지만 닫기 & 적용을 선택하기 전에 추가 단계를 수행하여 Power Query 편집기에서 데이터를 정리하고 변환해도 됩니다.  이러한 추가 단계는 이 모듈의 뒷부분에서 설명합니다.