자습서: 소개
적용 대상:✅ Microsoft Fabric의 SQL 분석 엔드포인트 및 웨어하우스
Microsoft Fabric은 모든 엔터프라이즈의 모든 분석 요구 사항에 대한 원스톱 상점을 제공합니다. 데이터 이동, 데이터 레이크, 데이터 엔지니어링, 데이터 통합 및 데이터 과학, 실시간 분석 및 비즈니스 인텔리전스를 포함한 전체 서비스 스펙트럼을 다룹니다. Microsoft Fabric을 사용하면 여러 공급업체의 서로 다른 서비스를 함께 연결할 필요가 없습니다. 대신, 고객은 쉽게 이해하고, 온보딩하고, 만들고, 운영할 수 있는 엔드투엔드의 고도로 통합된 단일 포괄적인 제품을 즐깁니다. Microsoft Fabric에서 제공하는 폭, 깊이 및 수준의 통합을 제공하는 다른 제품은 없습니다. 또한 Microsoft Purview는 규정 준수 및 거버넌스 요구 사항을 충족하기 위해 기본적으로 모든 테넌트에 포함됩니다.
이 자습서의 목적
Microsoft Fabric의 많은 개념은 데이터 및 분석 전문가에게 익숙할 수 있지만 새 환경에서 이러한 개념을 적용하는 것은 어려울 수 있습니다. 이 자습서는 Microsoft Fabric 사용자 환경, 다양한 환경 및 통합 지점, Microsoft Fabric 전문가와 시민 개발자 환경에 대한 기본적인 이해를 구축하기 위해 데이터 획득부터 데이터 사용에 이르는 엔드투엔드 시나리오를 단계별로 안내하도록 설계되었습니다.
자습서는 참조 아키텍처, 기능 및 특징의 전체 목록 또는 특정 모범 사례의 권장 사항이 아닙니다.
Data Warehouse 엔드투엔드 시나리오
이 자습서의 필수 조건으로 다음 단계를 완료합니다.
- Power BI 온라인 계정에 로그인하거나, 계정이 아직 없는 경우 무료 평가판에 가입합니다.
- 테넌트에서 Microsoft Fabric 을 사용하도록 설정합니다.
이 자습서에서는 가상의 Wide World Importers 회사에서 웨어하우스 개발자의 역할을 수행하고 Microsoft Fabric 포털에서 다음 단계를 완료하여 엔드투엔드 Data Warehouse 솔루션을 빌드하고 구현합니다.
- 작업 영역만듭니다.
- 웨어하우스를 만듭니다.
- 데이터 파이프라인을 사용하여 원본에서 Data Warehouse 차원 모델로 데이터를 수집합니다.
- 웨어하우스에서 T-SQL 사용하여 테이블을 만듭니다.
- SQL 쿼리 편집기를 사용하여 T-SQL을 통해 데이터를 로드합니다.
- SQL 쿼리 편집기를 사용하여 T-SQL 사용하여 테이블을 복제합니다.
- 저장 프로시저 사용하여 데이터를 변환하여 집계된 데이터 세트를 만듭니다.
- T-SQL로 시간 여행을 통해 특정 시점의 데이터를 확인하세요.
- 데이터 웨어하우스에서 결과를 검색하는 시각적 쿼리 편집기 사용하여 쿼리를 만듭니다.
- 데이터를 Notebook에서 분석합니다.
- SQL 쿼리 편집기를 사용하여 웨어하우스 간 쿼리 만들고 실행합니다.
- DirectLake 의미 체계 모델 및 Power BI 보고서 만들어 데이터를 분석합니다.
- OneLake 카탈로그에서 보고서 생성합니다.
- 작업 영역 및 기타 항목을 삭제하여 자습서 리소스를 정리합니다.
Data Warehouse 엔드투엔드 아키텍처
데이터 원본 - Microsoft Fabric을 사용하면 Azure Data Services, 기타 클라우드 플랫폼 및 온-프레미스 데이터 원본에 쉽고 빠르게 연결하여 데이터를 수집할 수 있습니다.
수집 - Microsoft Fabric 파이프라인의 일부로 200개 이상의 네이티브 커넥터를 사용하고 데이터 흐름을 사용하여 데이터 변환을 끌어서 놓으면 조직에 대한 인사이트를 신속하게 작성할 수 있습니다. 바로 가기는 복사하거나 이동하지 않고도 기존 데이터에 연결하는 방법을 제공하는 Microsoft Fabric의 새로운 기능입니다. 이 자습서의 뒷부분에서 바로 가기 기능에 대한 자세한 내용을 확인할 수 있습니다.
변환 및 저장 - Microsoft Fabric은 Delta Lake 형식을 표준화합니다. 즉, Microsoft Fabric의 모든 엔진이 OneLake에 저장된 동일한 데이터를 읽고 작업할 수 있으므로 데이터 중복성이 필요하지 않습니다. 이 스토리지를 사용하면 조직의 필요에 따라 Data Warehouse 또는 데이터 메시를 빌드할 수 있습니다. 변환의 경우 파이프라인/데이터 흐름을 사용하는 로우코드 또는 노코드 환경을 선택하거나 코드 우선 환경에 T-SQL을 사용할 수 있습니다.
사용 - 보고 및 시각화를 위해 업계 최고의 비즈니스 인텔리전스 도구인 Power BI에서 웨어하우스의 데이터를 사용할 수 있습니다. 각 웨어하우스에는 필요한 경우 다른 보고 도구에서 데이터를 쉽게 연결하고 쿼리할 수 있는 기본 제공 TDS 엔드포인트가 제공됩니다. 웨어하우스를 만들면 기본 의미 체계 모델이라고 하는 보조 항목이 동일한 이름으로 동시에 생성됩니다. 기본 의미 체계 모델을 사용하여 몇 가지 단계로 데이터 시각화를 시작할 수 있습니다.
샘플 데이터
샘플 데이터의 경우 WWI(Wide World Importers) 샘플 데이터베이스를 사용합니다. Data Warehouse 엔드투엔드 시나리오의 경우 Microsoft Fabric 플랫폼의 규모 및 성능 기능을 자세히 살펴보기에 충분한 데이터를 생성했습니다.
WWI(Wide World Importers)는 샌프란시스코 베이 지역에서 운영하는 도매 참신 상품 수입 및 유통 업체입니다. 도매업자로서, WWI의 고객은 주로 개인에게 재판매하는 회사입니다. WWI는 전문 상점, 슈퍼마켓, 컴퓨팅 상점, 관광 명소 상점, 일부 개인을 포함하여 미국 전역의 소매 고객에게 판매합니다. WWI는 WWI를 대신하여 제품을 홍보하는 에이전트 네트워크를 통해 다른 도매업자에게도 판매합니다. 회사 프로필 및 운영에 대한 자세한 내용은 Microsoft SQL용 Wide World Importers 샘플 데이터베이스를 참조하세요.
일반적으로 트랜잭션 시스템(또는 LOB(기간 업무) 애플리케이션)의 데이터를 데이터 레이크 또는 Data Warehouse 준비 영역으로 가져옵니다. 그러나 이 자습서에서는 WWI에서 제공하는 차원 모델을 초기 데이터 원본으로 사용합니다. 데이터를 Data Warehouse로 수집하고 T-SQL을 통해 변환하는 원본으로 사용합니다.
데이터 모델
WWI 차원 모델에는 여러 팩트 테이블이 포함되어 있지만 이 자습서에서는 다음과 같이 fact_sale
테이블 및 관련 차원에만 집중하여 이 엔드투엔드 Data Warehouse 시나리오를 보여 줍니다.
다음 단계
자습서: 작업 영역 만들기