이 문서에서는 온-프레미스 데이터 웨어하우스에서 클라우드 환경으로 데이터를 전송한 다음 BI(비즈니스 인텔리전스) 모델을 사용하여 데이터를 제공하는 방법을 설명합니다. 이 방법을 최종 목표 또는 클라우드 기반 구성 요소로 전체 현대화를 향한 첫 번째 단계로 사용할 수 있습니다.
이 지침은 Azure Synapse Analytics 엔드 투 엔드 시나리오 기반으로 합니다. 이 프로세스는 Azure Synapse Analytics 파이프라인을 사용하여 SQL 데이터베이스에서 SQL 풀로 데이터를 수집합니다. 그런 다음 분석을 위해 데이터 변환을 수행합니다. 이 문서에서는 Azure Synapse Analytics 파이프라인에 중점을 두지만 Azure Data Factory 파이프라인 또는 패브릭 Data Factory 파이프라인을 사용하여 이러한 작업을 수행할 수도 있습니다.
이 아키텍처를 사용하는 경우
엔터프라이즈 BI의 비즈니스 요구 사항을 충족하기 위해 다양한 방법을 사용할 수 있습니다. 현재 기술 투자, 인적 기술, 현대화 타임라인, 미래 목표, PaaS(Platform as a Service) 또는 SaaS(Software as a Service)에 대한 선호도가 있는지 여부와 같은 다양한 측면이 비즈니스 요구 사항을 정의합니다.
다음 디자인 방법을 고려합니다.
Microsoft Fabric 레이크하우스
Fabric 및 Azure Databricks는 Azure Databricks 및 Power BI에 기존 투자를 하고 패브릭으로 현대화하려는 고객을 위해.
Azure SQL 에코시스템 및 패브릭 사용하는 중소기업용 Enterprise BI
SaaS를 선호하는 고객을 위해 Fabric에서 완전히 데이터 웨어하우징
이 문서의 아키텍처에서는 Azure Synapse Analytics 데이터 웨어하우스를 엔터프라이즈 의미 체계 모델의 영구 계층으로 사용하고 비즈니스 인텔리전스용 Power BI를 사용한다고 가정합니다. 이 PaaS 접근 방식은 다양한 비즈니스 요구 사항 및 기본 설정을 수용할 수 있는 유연성을 제공합니다.
아키텍처
Azure Synapse Analytics를 사용하는 엔터프라이즈 BI 아키텍처를 보여 주는
이 아키텍처의 Visio 파일을 다운로드합니다.
워크플로
데이터 원본
- Azure의 SQL Server 데이터베이스에는 원본 데이터가 포함됩니다. 온-프레미스 환경을 시뮬레이션하기 위해 이 시나리오에 대한 배포 스크립트는 Azure SQL 데이터베이스를 구성합니다. AdventureWorks 샘플 데이터베이스는 원본 데이터 스키마 및 샘플 데이터로 사용됩니다. 자세한 내용은 SQL Server 데이터 복사 및 변환참조하세요.
수집 및 데이터 스토리지
Azure Data Lake Storage 데이터 수집 중 임시 준비 영역입니다. PolyBase를 사용하여 Azure Synapse Analytics 전용 SQL 풀데이터를 복사할 수 있습니다.
Azure Synapse Analytics 대규모 데이터에 대한 분석을 수행하는 분산 시스템입니다. 대규모 병렬 처리를 지원하므로 고성능 분석을 실행할 수 있습니다. Azure Synapse Analytics 전용 SQL 풀은 온-프레미스 환경에서 지속적인 수집을 위한 대상입니다. SQL 풀은 DirectQuery를 통해 Power BI 데이터를 제공하고 추가 처리를 수행할 수 있습니다.
Azure Synapse Analytics 파이프라인을 azure Synapse Analytics 작업 영역 내에서 데이터 수집 및 변환을 오케스트레이션할 있습니다.
분석 및 보고
- 이 시나리오의 데이터 모델링 접근 방식은 엔터프라이즈 모델BI 의미 체계 모델결합합니다. Azure Synapse Analytics 전용 SQL 풀 엔터프라이즈 모델이 포함되어 있습니다. Power BI Premium 용량 F64 BI 의미 체계 모델을 포함합니다. Power BI는 DirectQuery를 통해 데이터에 액세스합니다.
구성 요소
이 시나리오에서는 다음 구성 요소를 사용합니다.
Azure SQL Database Azure에서 호스트되는 PaaS SQL 서버입니다. 이 아키텍처는 SQL Database를 사용하여 마이그레이션 시나리오에 대한 데이터 흐름을 보여 줍니다.
Data Lake Storage 중간 마이그레이션 결과를 유지하는 데 사용되는 구조화되지 않은 데이터에 대한 유연한 클라우드 스토리지를 제공합니다.
Azure Synapse Analytics 데이터 웨어하우징 및 빅 데이터 시스템을 위한 엔터프라이즈 분석 서비스입니다. Azure Synapse Analytics는 엔터프라이즈 의미 체계 모델링 및 서비스 분야에서 기본 컴퓨팅 및 영구 스토리지 역할을 합니다.
Power BI Premium 이 시나리오에서 데이터를 표시하고 시각화하는 BI 도구입니다.
Microsoft Entra ID 인증 및 권한 부여 흐름을 지원하는 다중 클라우드 ID 및 네트워크 솔루션 제품군입니다.
단순화된 아키텍처
시나리오 정보
이 시나리오에서 조직에는 대규모 온-프레미스 데이터 웨어하우스를 포함하는 SQL 데이터베이스가 있습니다. 조직은 Azure Synapse Analytics를 사용하여 분석을 수행한 다음, Power BI를 통해 사용자 및 분석에 이러한 인사이트를 전달하려고 합니다.
인증
Microsoft Entra ID는 Power BI 대시보드 및 앱에 연결하는 사용자를 인증합니다. Single Sign-On은 Azure Synapse Analytics 프로비전된 풀의 데이터 원본에 사용자를 연결합니다. 권한 부여는 원본에서 발생합니다.
증분 로드
자동화된 추출, 변환, 로드(ETL) 또는 ELT(추출, 로드, 변환) 프로세스를 실행하는 경우 이전 실행 이후 변경된 데이터만 로드해야 합니다. 이 프로세스를 증분 로드호출합니다. 반대로 전체 로드는 모든 데이터를 로드합니다. 증분 로드를 수행하려면 변경된 데이터를 식별하는 방법을 결정합니다. 높은 워터 마크 값 접근 방식을 사용하여 원본 테이블에서 날짜-시간 열 또는 고유 정수 열의 최신 값을 추적할 수 있습니다.
SQL Server에서 임시 테이블 사용할 수 있습니다. 임시 테이블은 데이터 변경 기록을 저장하는 시스템 버전 테이블입니다. 데이터베이스 엔진은 별도 기록 테이블의 모든 변경 기록을 자동으로 레코드합니다. 기록 데이터를 쿼리하려면 쿼리에 FOR SYSTEM_TIME
절을 추가할 수 있습니다. 내부적으로 데이터베이스 엔진은 기록 테이블을 쿼리하지만 애플리케이션에 투명합니다.
임시 테이블은 차원 데이터를 지원하며 시간이 지남에 따라 변경 될 수 있습니다. 팩트 테이블은 대개 시스템 버전 기록을 유지하는 것이 사리에 맞지 않은 경우에 판매 같은 변경이 불가능한 트랜잭션을 나타냅니다. 대신 트랜잭션에는 일반적으로 트랜잭션 날짜를 나타내는 열이 있습니다. 열은 워터마크 값으로 사용할 수 있습니다. 예를 들어 AdventureWorks 데이터 웨어하우스에서 SalesLT.*
테이블에는 LastModified
필드가 있습니다.
ELT 파이프라인의 일반적인 흐름은 다음과 같습니다.
원본 데이터베이스의 각 테이블의 경우 마지막 ELT 작업이 실행될 때 마감 시간을 추적하여, 데이터 웨어하우스에 이 정보를 저장합니다. (초기 설치 시 항상 시간은
1-1-1900
로 설정돼 있습니다.)데이터 내보내기 단계 중 마감 시간은 원본 데이터베이스의 저장 프로시저 집합에 매개 변수로 전달됩니다. 이러한 저장 프로시저는 중단 시간 후에 변경되거나 생성된 모든 레코드를 쿼리합니다. 예의 모든 테이블에 대해
ModifiedDate
열을 사용할 수 있습니다.데이터 마이그레이션이 완료되면 마감 시간을 저장하는 테이블을 업데이트합니다.
데이터 파이프라인
이 시나리오에서는 AdventureWorks 샘플 데이터베이스를 데이터 원본으로 사용합니다. 증분 데이터 로드 패턴은 가장 최근 파이프라인 실행 후에 수정되거나 추가된 데이터만 로드되도록 합니다.
메타데이터 기반 복사 도구
Azure Synapse Analytics 파이프라인 내에서 기본 제공 메타데이터 기반 복사 도구는 관계형 데이터베이스에 포함된 모든 테이블을 증분 방식으로 로드합니다.
마법사 인터페이스를 사용하여 데이터 복사 도구를 원본 데이터베이스에 연결합니다.
연결한 후 각 테이블에 대해 증분 로드 또는 전체 로드를 구성합니다.
데이터 복사 도구는 컨트롤 테이블을 생성하는 데 필요한 파이프라인 및 SQL 스크립트를 만듭니다. 이 표는 증분 로드 프로세스에 대해 각 테이블의 상위 워터마크 값 또는 열과 같은 데이터를 저장합니다.
이러한 스크립트를 실행한 후 파이프라인은 모든 원본 데이터 웨어하우스 테이블을 Azure Synapse Analytics 전용 풀에 로드합니다.
azure Synapse Analytics의 메타데이터 기반 데이터 복사 도구를 보여 주는
이 도구는 데이터를 로드하기 전에 데이터베이스의 테이블을 반복하는 세 개의 파이프라인을 만듭니다.
파이프라인은 다음 작업을 수행합니다.
파이프라인 실행에서 복사할 개체(예: 테이블) 수를 계산합니다.
로드하거나 복사할 각 개체를 반복합니다.
파이프라인이 각 개체를 반복한 후 다음 작업을 수행합니다.
델타 로드가 필요한지 여부를 확인합니다. 그렇지 않으면 파이프라인이 정상적인 전체 부하를 완료합니다.
컨트롤 테이블에서 상위 워터마크 값을 검색합니다.
원본 테이블의 데이터를 Data Lake Storage의 스테이징 계정으로 복사합니다.
PolyBase 또는 Copy 명령과 같이 선택한 복사 방법을 통해 전용 SQL 풀에 데이터를 로드합니다.
컨트롤 테이블의 상위 워터마크 값을 업데이트합니다.
Azure Synapse Analytics SQL 풀에 데이터 로드
복사 작업은 SQL 데이터베이스에서 Azure Synapse Analytics SQL 풀로 데이터를 복사할 있습니다. 이 예제의 SQL 데이터베이스는 Azure에 있으므로 Azure 통합 런타임을 사용하여 SQL 데이터베이스에서 데이터를 읽고 지정된 스테이징 환경에 데이터를 씁니다.
그런 다음 복사 문은 준비 환경에서 Azure Synapse Analytics 전용 풀로 데이터를 로드합니다.
Azure Synapse Analytics 파이프라인 사용
Azure Synapse Analytics의 파이프라인은 증분 부하 패턴을 완료하기 위해 정렬된 작업 집합을 정의합니다. 수동 또는 자동 트리거는 파이프라인을 시작합니다.
데이터 변환
이 참조 아키텍처의 샘플 데이터베이스는 작으므로 파티션이 없는 복제된 테이블이 만들어집니다. 프로덕션 워크로드의 경우 분산 테이블은 쿼리 성능을 향상시킬 수 있습니다. 자세한 내용은 Azure Synapse Analytics 분산 테이블을 디자인하기 위한지침을 참조하세요. 예제 스크립트는 정적 리소스 클래스통해 쿼리를 실행합니다.
프로덕션 환경에서는 라운드 로빈 배포가 있는 스테이징 테이블을 만드는 것이 좋습니다. 그런 다음 데이터를 변환하고 클러스터형 columnstore 인덱스가 있는 프로덕션 테이블로 이동하여 최상의 전반적인 쿼리 성능을 제공합니다. Columnstore 인덱스는 많은 레코드를 검색하는 쿼리에 최적화됩니다.
Columnstore 인덱스는 단일 조회 또는 단일 행 조회에 대해 최적으로 수행되지 않습니다. 자주 싱글톤 조회를 수행해야 하는 경우 테이블에 비클러스터형 인덱스를 추가하여 속도를 높일 수 있습니다. 그러나 단일 조회는 일반적으로 온라인 트랜잭션 처리 워크로드보다 데이터 웨어하우스 시나리오에서 덜 일반적입니다. 자세한 내용은 Azure Synapse Analytics 인덱스 테이블을 참조하세요.
참고
클러스터형 columnstore 테이블은 varchar(max)
, nvarchar(max)
또는 varbinary(max)
데이터 형식을 지원하지 않습니다. 이러한 데이터 형식을 사용하는 경우 힙 또는 클러스터형 인덱스로 간주합니다. 이러한 열을 별도의 테이블에 배치하는 것도 고려할 수 있습니다.
Power BI Premium을 사용하여 데이터 액세스, 모델링 및 시각화
Power BI Premium은 Azure의 데이터 원본에 연결하는 몇 가지 옵션을 지원합니다. Azure Synapse Analytics 프로비전된 풀을 사용하여 다음 작업을 수행할 수 있습니다.
- 가져오기: 데이터를 Power BI 모델로 가져옵니다.
- DirectQuery: 관계형 스토리지에서 직접 데이터를 가져옵니다.
- 복합 모델: 일부 테이블에는 Import를 결합하고 다른 테이블에는 DirectQuery를 결합합니다.
이 시나리오에서는 적은 양의 데이터와 모델 복잡성이 낮기 때문에 DirectQuery 대시보드를 사용합니다. DirectQuery는 쿼리를 아래의 강력한 컴퓨팅 엔진에 위임하고 원본에서 광범위한 보안 기능을 사용합니다. DirectQuery는 결과가 항상 최신 원본 데이터와 일치하도록 합니다.
가져오기 모드는 가장 빠른 쿼리 응답 시간을 제공합니다. 다음과 같은 경우 가져오기 모드를 고려합니다.
- 모델은 Power BI의 메모리 내에 완전히 맞습니다.
- 새로 고침 간의 데이터 대기 시간은 허용됩니다.
- 원본 시스템과 최종 모델 간에 복잡한 변환이 필요합니다.
이 경우 최종 사용자는 Power BI 새로 고침에 지연 없이 최신 데이터에 대한 모든 액세스 권한을 원하며 Power BI 데이터 세트 용량을 초과하는 모든 기록 데이터를 원합니다. Power BI 데이터 세트는 용량 크기에 따라 25~400GB를 처리할 수 있습니다. 전용 SQL 풀의 데이터 모델은 이미 별모양 스키마에 있으며 변환이 필요하지 않으므로 DirectQuery가 적절한 선택입니다.
Power BI Premium 사용하여 큰 모델, 페이지를 매긴 보고서 및 배포 파이프라인을 관리합니다. 기본 제공 Azure Analysis Services 엔드포인트를 활용합니다. 고유한 가치 제안을 가진 전용 용량을 보유할 수도 있습니다.
BI 모델이 증가하거나 대시보드 복잡성이 증가하면 복합 모델로 전환하고 하이브리드 테이블을 통해 조회 테이블의 일부를 가져오고 사전 집계된 데이터를 가져올 수 있습니다. 가져온 데이터 세트에 대해 Power BI 내에서 쿼리 캐싱 사용하도록 설정하고 스토리지 모드 속성에 이중 테이블을 사용할 수 있습니다.
복합 모델 내에서 데이터 세트는 가상 통과 계층 역할을 합니다. 사용자가 시각화와 상호 작용할 때 Power BI는 Azure Synapse Analytics SQL 풀에 대한 SQL 쿼리를 생성합니다. Power BI는 효율성에 따라 메모리 내 또는 DirectQuery 스토리지를 사용할지 여부를 결정합니다. 엔진은 메모리 내에서 DirectQuery로 전환할 시기를 결정하고 논리를 Azure Synapse Analytics SQL 풀에 푸시합니다. 쿼리 테이블의 컨텍스트에 따라 캐시(가져온) 또는 캐시되지 않은 복합 모델 역할을 할 수 있습니다. 메모리에 캐시할 테이블을 선택하거나, 하나 이상의 DirectQuery 원본에서 데이터를 결합하거나, DirectQuery 원본 데이터와 가져온 데이터를 결합할 수 있습니다.
Azure Synapse Analytics 프로비전된 풀에서 DirectQuery를 사용하는 경우:
Azure Synapse Analytics 결과 집합 캐싱 사용하여 반복적인 사용을 위해 사용자 데이터베이스의 쿼리 결과를 캐시합니다. 이 방법은 쿼리 성능을 밀리초로 향상시키고 컴퓨팅 리소스 사용량을 줄입니다. 캐시된 결과 집합을 사용하는 쿼리는 Azure Synapse Analytics에서 동시성 슬롯을 사용하지 않으므로 기존 동시성 제한에 포함되지 않습니다.
Azure Synapse Analytics 구체화된 뷰 사용하여 테이블과 같은 데이터를 사전 계산, 저장 및 유지 관리합니다. 구체화된 뷰에서 모든 데이터 또는 데이터의 하위 집합을 사용하는 쿼리는 정의된 구체화된 뷰를 직접 참조하지 않고도 더 빠른 성능을 얻을 수 있습니다.
고려 사항
이러한 고려 사항은 워크로드의 품질을 향상시키는 데 사용할 수 있는 일련의 기본 원칙인 Azure Well-Architected Framework의 핵심 요소를 구현합니다. 자세한 내용은 Well-Architected Framework참조하세요.
보안
보안은 의도적인 공격 및 중요한 데이터 및 시스템의 오용에 대한 보증을 제공합니다. 자세한 내용은 보안대한
클라우드 현대화는 데이터 위반, 맬웨어 감염 및 악성 코드 주입과 같은 보안 문제를 소개합니다. 부적절한 보안 조치가 주요 문제를 일으킬 수 있으므로 문제를 해결할 수 있는 클라우드 공급자 또는 서비스 솔루션이 필요합니다.
이 시나리오에서는 네트워크, ID, 개인 정보 보호 및 권한 부여 컨트롤과 같은 계층화된 보안 컨트롤의 조합을 사용하여 가장 까다로운 보안 문제를 해결합니다. Azure Synapse Analytics 프로비전된 풀은 대부분의 데이터를 저장합니다. Power BI는 Single Sign-On을 통해 DirectQuery를 통해 데이터에 액세스합니다. 인증을 위해 Microsoft Entra ID를 사용할 수 있습니다. 프로비전된 풀 내에서 데이터 권한 부여에 대한 광범위한 보안 제어도 있습니다.
몇 가지 일반적인 보안 질문은 다음과 같습니다.
데이터를 볼 수 있는 사용자를 정의합니다.
- 데이터가 데이터 위반 위험을 완화하기 위해 연방, 지역 및 회사 지침을 준수하는지 확인합니다. Azure Synapse Analytics는 규정 준수를 달성하기 위해 여러 데이터 보호 기능을 제공합니다.
사용자의 ID를 확인하는 방법을 결정합니다.
네트워크 및 데이터의 무결성, 기밀성 및 액세스를 보호하려면 네트워크 보안 기술을 선택합니다.
- 네트워크 보안 옵션을 사용하여 Azure Synapse Analytics를 보호할 수 있습니다.
위협을 감지하고 알리는 도구를 선택합니다.
- Azure Synapse Analytics SQL 감사, SQL 위협 탐지 및 취약성 평가와 같은 위협 탐지 기능을 사용하여 데이터베이스를 감사, 보호 및 모니터링합니다.
스토리지 계정에서 데이터를 보호하는 방법을 결정합니다.
- 빠르고 일관된 응답 시간이 필요하거나 초당 IOP(입력/출력 작업) 수가 많은 워크로드에 Azure Storage 계정을 사용합니다. 스토리지 계정은 모든 데이터 개체를 저장하고 여러 스토리지 계정 보안 옵션을수 있습니다.
비용 최적화
비용 최적화는 불필요한 비용을 줄이고 운영 효율성을 개선하는 방법에 중점을 둡니다. 자세한 내용은 비용 최적화를 위한 디자인 검토 검사 목록을 참조하세요.
이 섹션에서는 이 솔루션과 관련된 다양한 서비스의 가격 책정에 대한 정보를 제공하고 샘플 데이터 세트를 사용하여 이 시나리오에 대한 결정을 언급합니다. Azure 가격 계산기 이 시작 구성을 사용하고 시나리오에 맞게 조정합니다.
Azure Synapse Analytics
Azure Synapse Analytics는 컴퓨팅 및 스토리지 수준을 독립적으로 확장하는 데 사용할 수 있는 서버리스 아키텍처입니다. 컴퓨팅 리소스는 사용량에 따라 비용이 발생합니다. 요청 시 이러한 리소스의 크기를 조정하거나 일시 중지할 수 있습니다. 스토리지 리소스는 테라바이트당 비용이 발생하므로 데이터를 수집할 때 비용이 증가합니다.
Azure Synapse Analytics 파이프라인
세 가지 주요 구성 요소는 파이프라인의 가격에 영향을 줍니다.
- 데이터 파이프라인 작업 및 통합 런타임 시간
- 데이터 흐름 클러스터 크기 및 구현
- 운영 요금
가격 책정 세부 정보는 Azure Synapse Analytics 가격 책정 데이터 통합 탭을 참조하세요.
가격은 구성 요소 또는 활동, 빈도 및 통합 런타임 단위 수에 따라 달라집니다.
표준 Azure 호스팅 통합 런타임을 사용하는 샘플 데이터 세트의 경우 데이터 복사 작업 파이프라인의 핵심 역할을. 원본 데이터베이스의 모든 엔터티(테이블)에 대한 일일 일정에 따라 실행됩니다. 이 시나리오에는 데이터 흐름이 포함되지 않습니다. 또한 파이프라인이 매월 100만 개 미만의 작업을 실행하기 때문에 운영 비용이 발생하지 않습니다.
Azure Synapse Analytics 전용 풀 및 스토리지
샘플 데이터 세트의 경우 500개의 DWU(데이터 웨어하우스 단위)를 프로비전하여 분석 부하에 대한 원활한 환경을 제공할 수 있습니다. 보고 목적으로 업무 시간 동안 컴퓨팅을 유지할 수 있습니다. 솔루션이 프로덕션으로 이동하는 경우 비용 효율적인 전략으로 예약된 데이터 웨어하우스 용량을 사용합니다. 다양한 기술을 사용하여 비용 및 성능 메트릭을 최대화합니다.
Azure Synapse Analytics 전용 풀에 대한 가격 책정 세부 정보는 Azure Synapse Analytics 가격 책정데이터 웨어하우징 탭을 참조하세요. 전용 소비 모델에서 고객은 시간당 가동 시간당 프로비전된 각 DWU에 대한 비용이 발생합니다. 또한 미사용 데이터 크기, 스냅샷 및 지역 중복성을 포함하여 데이터 스토리지 비용을 고려합니다.
Blob Storage
Azure Storage 예약된 용량을 사용하여 스토리지 비용을 절감하는 것이 좋습니다. 이 모델에서는 고정 스토리지 용량을 1년 또는 3년 동안 예약하면 할인을 가져옵니다. 자세한 내용은 예약된 용량 사용하여 Blob Storage에 대한 비용 최적화참조하세요. 이 시나리오에서는 영구 스토리지를 사용하지 않습니다.
Power BI Premium
이 시나리오에서는 Power BI Premium 작업 영역 기본 제공 성능 향상을 사용하여 까다로운 분석 요구 사항을 수용합니다.
자세한 내용은 Power BI 가격 책정참조하세요.
운영 우수성
운영 우수성은 애플리케이션을 배포하고 프로덕션 환경에서 계속 실행하는 운영 프로세스를 다룹니다. 자세한 내용은 운영 우수성대한
Azure DevOps 릴리스 파이프라인 및 GitHub Actions를 사용하여 여러 환경에서 Azure Synapse Analytics 작업 영역의 배포를 자동화합니다. 자세한 내용은 Azure Synapse Analytics 작업 영역 연속 통합 및 지속적인 업데이트를 참조하세요.
각 워크로드를 별도의 배포 템플릿에 배치하고 리소스를 소스 제어 시스템에 저장합니다. CI/CD(지속적인 통합 및 지속적인 업데이트) 프로세스의 일부로 템플릿을 함께 또는 개별적으로 배포할 수 있습니다. 이 방법은 자동화 프로세스를 간소화합니다. 이 아키텍처에는 다음과 같은 네 가지 주요 워크로드가 있습니다.
- 데이터 웨어하우스 서버 및 관련 리소스
- Azure Synapse Analytics 파이프라인
- 대시보드, 앱 및 데이터 세트를 포함한 Power BI 자산
- 온-프레미스에서 클라우드로 시뮬레이션된 시나리오
가능한 경우 워크로드를 준비하는 것이 좋습니다. 다양한 단계에 워크로드를 배포합니다. 다음 단계로 이동하기 전에 각 단계에서 유효성 검사를 실행합니다. 이 방법은 제어된 방식으로 프로덕션 환경에 업데이트를 푸시하고 예기치 않은 배포 문제를 최소화합니다. 청록색 배포 및 카나리아 릴리스 전략을 사용하여 라이브 프로덕션 환경을 업데이트합니다.
롤백 전략을 사용하여 실패한 배포를 처리합니다. 예를 들어 배포 기록에서 이전에 성공한 배포를 자동으로 다시 배포할 수 있습니다. Azure CLI에서
--rollback-on-error
플래그를 사용합니다.Azure Monitor 사용하여 통합 모니터링 환경을 위해 데이터 웨어하우스 및 전체 Azure 분석 플랫폼의 성능을 분석합니다. Azure Synapse Analytics는 Azure Portal 내에 모니터링 환경을 제공하여 데이터 웨어하우스 워크로드와 관련된 인사이트를 제공합니다. Azure Portal을 사용하여 데이터 웨어하우스를 모니터링합니다. 구성 가능한 보존 기간, 경고, 권장 사항, 메트릭 및 로그에 대한 사용자 지정 가능한 차트 및 대시보드를 제공합니다.
자세한 내용은 다음 리소스를 참조하세요.
- 자습서: Azure Synapse Analytics 시작
- Azure CLI 사용하여 Azure Synapse Analytics 작업 영역 만들기
성능 효율성
성능 효율성은 사용자 요구를 효율적으로 충족하기 위해 워크로드의 크기를 조정하는 기능을 의미합니다. 자세한 내용은 성능 효율성에 대한 디자인 검토 검사 목록을 참조하세요.
이 섹션에서는 이 데이터 세트를 수용하기 위한 크기 조정 결정에 대해 자세히 설명합니다.
Azure Synapse Analytics 프로비전된 풀
다양한 데이터 웨어하우스 구성사용할 수 있습니다.
DWU | 컴퓨팅 노드 수 | 노드당 배포 수 |
---|---|---|
DW100c | 1 | 60 |
-- TO -- |
||
DW30000c | 60 | 1 |
특히 대규모 DWU의 경우 스케일 아웃의 성능 이점을 확인하려면 1TB 이상의 데이터 세트를 사용합니다. 전용 SQL 풀에 가장 적합한 DWU 수를 찾으려면 확장 및 축소해 보세요. 데이터를 로드한 후 DWU 수가 다른 쿼리를 실행합니다. 크기 조정이 빠르므로 다양한 성능 수준을 쉽게 실험할 수 있습니다.
최상의 DWU 수 찾기
개발 중인 전용 SQL 풀의 경우 DW400c 또는 DW200c같은 소수의 DWU를 시작점으로 선택합니다. 각 DWU 수에 대한 애플리케이션 성능을 모니터링합니다. 선형 배율을 가정하고 DWU를 늘리거나 줄이는 데 필요한 양을 결정합니다. 비즈니스 요구 사항에 맞는 최적 성능 수준에 도달할 때까지 계속 조정합니다.
Azure Synapse Analytics SQL 풀 크기 조정
Azure Synapse Analytics의 파이프라인 및 사용하는 복사 작업의 확장성 및 성능 최적화 기능은 복사 작업 성능 및 확장성 가이드참조하세요.
자세한 내용은 다음 리소스를 참조하세요.
- Azure Portal 사용하여 Azure Synapse Analytics SQL 풀에 대한 컴퓨팅 크기 조정
- Azure PowerShell 사용하여 전용 SQL 풀에 대한 컴퓨팅 크기 조정
- T-SQL 사용하여 Azure Synapse Analytics의 전용 SQL 풀에 대한 컴퓨팅 크기 조정
- 전용 SQL 풀 대한 컴퓨팅 관리
Power BI Premium 및 Fabric
이 문서에서는 Power BI Premium F64 용량 사용하여 BI 기능을 보여 줍니다. 패브릭의 전용 Power BI 용량은 F64(vCore 8개)에서 F1024(128개 vCore)에 이르기까지 다양합니다.
필요한 용량을 확인하려면 다음을 수행합니다.
참가자
Microsoft는 이 문서를 유지 관리합니다. 다음 기여자는 이 문서를 작성했습니다.
주요 작성자:
- Galina Polyakova | 선임 클라우드 솔루션 설계자
- Noah Costar | 클라우드 솔루션 설계자
- George Stevens | 클라우드 솔루션 설계자
기타 기여자:
- Jim McLeod | 클라우드 솔루션 설계자
- Miguel Myers | 선임 프로그램 관리자
비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인합니다.
다음 단계
- Power BI 프리미엄이란?
- Microsoft Entra ID란?
- Azure Databricks를 사용하여 Data Lake Storage 및 Azure Blob Storage에 액세스
- Azure Synapse Analytics란?
- Azure Data Factory 및 Azure Synapse Analytics의 파이프라인 및 작업
- Azure SQL란?