가져오기 모델을 개발할 시기 결정

완료됨

가져오기 모델은 스토리지 모드 속성이 가져오기로 설정된 테이블로 구성됩니다. 여기에는 DAX 수식을 사용하여 정의하는 계산 테이블도 포함됩니다.

가져오기 모델 이점

가져오기 모델은 많은 이점 때문에 가장 자주 개발되는 모델 프레임워크입니다. 가져오기 모델:

  • 데이터베이스, 파일, 피드, 웹 페이지, 데이터 흐름 등 모든 Power BI 데이터 원본 유형을 지원합니다.
  • 원본 데이터를 통합할 수 있습니다. 예를 들어 한 테이블은 관계형 데이터베이스에 데이터를 가져오고 관련 테이블은 웹 페이지에서 데이터를 가져올 수 있습니다.
  • 모든 DAX 및 Power Query(M) 기능을 지원합니다.
  • 계산된 테이블을 지원합니다.
  • 최상의 쿼리 성능을 제공합니다. 모델에 캐시된 데이터는 분석 쿼리(필터링, 그룹화 및 요약)에 최적화되어 있고 모델이 전적으로 메모리에 저장되기 때문입니다.

즉, 가져오기 모델은 가장 많은 옵션 및 디자인 유연성을 제공하며 빠른 성능을 제공합니다. 이러한 이유로 Power BI Desktop은 기본적으로 "데이터를 가져올 때" 가져오기 스토리지 모드를 사용합니다.

다이어그램은 관계형 데이터베이스, Excel 통합 문서, 소셜 미디어 피드, Power BI 데이터 흐름을 포함하여 다양한 데이터 소스 유형의 데이터를 로드하는 별모양 스키마 가져오기 모델을 보여 줍니다.

가져오기 모델 제한 사항

많은 강력한 이점에도 불구하고 가져오기 모델에는 유의해야 할 제한 사항이 있습니다. 제한 사항은 모델 크기데이터 새로 고침과 관련이 있습니다.

모델 크기

Power BI는 모델 크기를 제한하는 데이터 세트 크기 제한을 적용합니다. 모델을 공유 용량에 게시하는 경우 데이터 세트당 1GB 제한이 있습니다. 이 크기 제한을 초과하면 데이터 세트가 새로 고쳐지지 않습니다. 모델을 전용 용량(Premium 용량이라고도 함)에 게시하는 경우 용량에 대용량 데이터 세트 스토리지 형식 설정을 사용하도록 설정하면 이 제한이 10GB 이상으로 증가할 수 있습니다.

테이블에 저장된 데이터의 양을 줄이기 위해 항상 노력해야 합니다. 이 전략은 모델 새로 고침 소요 시간을 단축하고 모델 쿼리 속도를 향상하는 데 도움이 됩니다. 다음과 같은 다양한 데이터 감소 기술을 적용할 수 있습니다.

  • 불필요한 열 제거
  • 불필요한 행 제거
  • 그룹화 및 요약을 통해 팩트 테이블의 세분성을 높임
  • 숫자 데이터에 대한 기본 설정을 사용하여 열 데이터 형식을 최적화
  • 모델의 계산 열 대신 Power Query의 사용자 지정 열을 우선적으로 사용
  • 파워 쿼리의 쿼리 로드 사용 안 함
  • 자동 날짜/시간 사용 안 함
  • DirectQuery 테이블 스토리지를 사용(이 모듈의 이후 단원에서 설명)

자세한 내용은 가져오기 모델링을 위한 데이터 축소 방법을 참조하세요.

참고

데이터 세트당 1GB 제한은 원본 시스템에서 수집되는 데이터의 볼륨이 아니라 Power BI 모델의 압축된 크기를 기준으로 합니다.

데이터 새로 고침

가져온 데이터는 주기적으로 새로 고쳐야 합니다. 데이터 세트 데이터는 마지막으로 성공한 데이터 새로 고침을 기준으로 최신입니다. 데이터를 최신 상태로 유지하려면 예약된 데이터 새로 고침을 설정하거나 보고서 소비자가 주문형 새로 고침을 수행할 수 있습니다.

Power BI는 예약된 새로 고침 작업을 실행할 수 있는 빈도를 제한합니다. 공유 용량에서는 하루 최대 8회, 전용 용량에서는 하루 최대 48회입니다.

이 대기 시간 수준이 허용 가능한지 결정해야 합니다. 이는 데이터의 속도(또는 변동성)와 사용자에게 최신 데이터를 알려야 하는 긴급도에 따라 달라지는 경우가 많습니다. 예약된 새로 고침 제한을 허용할 수 없는 경우 DirectQuery 스토리지 테이블을 사용하거나 하이브리드 테이블을 만드는 것이 좋습니다. 또는 다른 방법을 사용하고 실시간 데이터 세트를 대신 만듭니다.

하이브리드 테이블은 단원 4에 설명되어 있습니다. 실시간 데이터 세트에 대한 자세한 내용은 Power BI를 사용하여 실시간으로 데이터 모니터링 모듈을 확인하세요.

새로 고침 워크로드 및 소요 시간도 고려해야 합니다. 기본적으로 테이블을 새로 고치려면 Power BI는 모든 데이터를 제거하고 다시 로드합니다. 이러한 작업은 원본 시스템, 특히 대규모 팩트 테이블에 수용할 수 없는 부담을 줍니다. 이 부담을 줄이기 위해 증분 새로 고침 기능을 설정할 수 있습니다. 증분 새로 고침은 기간 파티션의 생성 및 관리를 자동화하고 새로 고침이 필요한 파티션만 지능적으로 업데이트합니다.

데이터 원본이 증분 새로 고침을 지원하는 경우 더 빠르고 신뢰할 수 있는 새로 고침이 실행되고 Power BI 및 원본 시스템의 리소스 소비가 감소할 수 있습니다.

고급 데이터 모델러는 자체 분할 전략을 사용자 지정할 수 있습니다. 자동화 스크립트는 테이블 파티션을 만들고, 관리하고, 새로 고칠 수 있습니다. 자세한 내용은 Power BI 사용 시나리오: 고급 데이터 모델 관리를 참조하세요. 이 사용 시나리오에서는 Power BI Premium에서 사용할 수 있는 XMLA 엔드포인트를 사용하는 방법에 대해 설명합니다.