Microsoft Fabric을 사용하여 엔드투엔드 분석 살펴보기

완료됨

스케일링 가능한 분석은 복잡하고 조각화되며 비용이 많이 들 수 있습니다. Microsoft Fabric을 사용하면 다양한 공급업체의 다양한 서비스를 결합하는 데 모든 시간을 소모할 필요가 없습니다. 대신 쉽게 이해하고, 설정하고, 만들고, 관리하는 단일 제품을 사용할 수 있습니다. 패브릭은 통합된 사용자 인터페이스에서 가상 사용자 최적화 환경 및 도구를 제공합니다.

간단한 공유 사용자 환경 외에도 Fabric은 통합 SaaS(Software-as-a-Service) 제품이며 모든 데이터는 OneLake에 단일 개방형 형식으로 저장됩니다. OneLake는 플랫폼의 모든 분석 엔진에서 액세스할 수 있습니다. Fabric은 스케일링 성능, 비용 효율성, 인터넷 연결을 통해 어디서나 액세스 가능성, Microsoft에서 제공하는 지속적인 업데이트 및 유지 관리를 제공합니다.

OneLake 살펴보기

OneLake는 데이터 전문가와 비즈니스가 데이터 프로젝트에서 협업할 수 있는 단일 통합 환경을 제공하는 Fabric의 레이크 중심 아키텍처입니다. Fabric의 OneLake 아키텍처는 데이터 팀 멤버 간의 협업을 용이하게 하며 다양한 시스템과 팀 간에 데이터를 이동하고 복사할 필요가 없어 시간을 절약합니다. OneCopy는 데이터를 이동하거나 복제하지 않고 단일 복사본에서 데이터를 읽을 수 있는, OneLake의 핵심 구성 요소입니다.

데이터용 OneDrive처럼 생각하세요. OneLake는 데이터를 이동하거나 복제하지 않고도 서로 다른 지역 및 클라우드에 걸쳐 있는 스토리지 위치를 단일 논리 레이크로 결합합니다. 조직 OneDrive를 사용하기 위해 Office 애플리케이션을 미리 연결하는 방식과 마찬가지로 Fabric의 모든 컴퓨팅 워크로드는 OneLake에서 작동하도록 미리 구성됩니다. Fabric의 데이터 웨어하우징, 데이터 엔지니어링(레이크하우스 및 Notebook), 데이터 통합(파이프라인 및 데이터 흐름), 실시간 인텔리전스 및 Power BI는 모두 추가 구성 없이도 OneLake를 네이티브 저장소로 사용합니다.

OneLake를 기반으로 빌드된 Fabric 아키텍처의 스크린샷

OneLake는 ADLS(Azure Data Lake Storage)를 기반으로 빌드되며 데이터를 Delta, Parquet, CSV, JSON 등을 비롯한 모든 파일 형식으로 저장할 수 있습니다.

즉, Fabric의 모든 컴퓨팅 엔진은 데이터를 OneLake에 자동으로 저장합니다. 그런 다음, OneLake에 저장된 데이터는 이동하거나 복사하지 않고도 모든 컴퓨팅 엔진에서 직접 액세스할 수 있습니다. 표 형식 데이터의 경우 패브릭의 분석 엔진은 Delta-Parquet 형식으로 데이터를 작성하고 모든 엔진은 형식과 원활하게 상호 작용합니다.

OneLake의 중요한 기능 중 하나는 다른 파일 또는 스토리지 위치를 가리키는 OneLake 내에 포함된 참조인 바로 가기를 만드는 기능입니다. 바로 가기를 사용하면 복사하지 않고도 기존 클라우드 데이터를 신속하게 소싱할 수 있으며 패브릭 경험이 동일한 원본에서 데이터를 파생하여 항상 동기화할 수 있습니다.

Delta-Parquet 스토리지 형식을 서버리스 컴퓨팅의 기초로 표시하는 OneLake 아키텍처의 스크린샷

패브릭 경험 살펴보기

패브릭은 특정 작업을 수행하고 원활하게 함께 작동하도록 설계된 일련의 분석 경험을 제공합니다. 패브릭의 경험은 다음과 같습니다.

  • Synapse 데이터 엔지니어링: 대규모 데이터 변환을 위해 Spark 플랫폼을 사용하는 데이터 엔지니어링입니다.
  • Synapse 데이터 웨어하우스: 데이터 사용을 지원하기 위해 업계 최고의 SQL 성능 및 규모를 갖춘 데이터 웨어하우징입니다.
  • Synapse 데이터 과학: 스케일링 가능한 환경에서 모델 학습 및 실행 추적을 위해 Azure Machine Learning 및 Spark를 사용하는 데이터 과학입니다.
  • Synapse 실시간 인텔리전스: 대량의 데이터를 실시간으로 쿼리하고 분석하는 실시간 인텔리전스입니다.
  • Data Factory: 데이터 이동 및 변환을 위해 Azure Data Factory 규모와 Power Query를 결합하는 데이터 통합입니다.
  • Power BI: 대화형 보고서를 통해 데이터를 의사 결정으로 변환하기 위한 비즈니스 인텔리전스.

패브릭은 이러한 모든 경험을 단일 플랫폼에서 통합하여 포괄적인 데이터 분석 솔루션을 제공합니다.

작업 영역 살펴보기

Fabric은 다양한 환경을 통해 만들어진 다양한 항목을 담기 위해 작업 영역을 사용합니다. 각 조직은 항목에 대한 액세스를 분리하고 제어하는 ​​방법을 사용자 지정할 수 있습니다. 레이크하우스 개발을 위한 전담 작업 영역과 레이크하우스 프로덕션을 위한 별도의 작업 영역이 사용될 수 있습니다.

Microsoft Fabric에서 작업 영역은 데이터, 보고서 및 기타 자산을 구성하고 관리하는 데 도움이 되는 논리적 컨테이너 역할을 합니다. 이를 통해 리소스를 명확하게 분리하여 액세스 제어와 보안 유지가 더 쉬워집니다. 각 작업 영역에는 고유한 권한 집합이 있어서 권한 있는 사용자만 콘텐츠를 보거나 수정할 수 있습니다. 이 구조는 비즈니스와 IT 사용자 모두에게 중요한 엄격한 액세스 제어를 유지하는 동시에 팀 내 협업을 지원합니다.

Microsoft Fabric의 작업 영역은 컴퓨팅 리소스를 관리하고 버전 제어를 위해 Git과 통합하는 설정도 제공합니다. 성능과 비용을 최적화하도록 컴퓨팅 설정을 구성하여 리소스를 효율적으로 사용할 수 있습니다. Git 통합을 사용하면 변경 내용을 추적하고, 코드에서 협업하고, 작업 내역을 유지할 수 있으며, 이는 개발 및 데이터 관리에 필수적입니다. 또한 작업 영역은 데이터 계보 및 영향 분석과 같은 기능을 지원하여 데이터 흐름과 종속성에 대한 포괄적인 보기를 제공하고, 이는 투명성과 의사 결정을 향상합니다.

보안 및 거버넌스 살펴보기

Fabric의 OneLake는 중앙에서 관리되며 협업을 위해 개방됩니다. 데이터는 한곳에서 안전하게 보호되고 관리되므로 사용자는 필요한 데이터를 쉽게 찾고 액세스할 수 있습니다. Fabric 관리는 관리 센터에서 중앙 집중화됩니다.

관리 센터에서 그룹 및 권한을 관리하고, 데이터 원본 및 게이트웨이를 구성하고, 사용 및 성능을 모니터링할 수 있습니다. 또한 관리 센터에서는 일반적인 작업을 자동화하고 다른 시스템과 Fabric을 통합하는 데 사용할 Fabric 관리 API 및 SDK에 액세스할 수 있습니다.

참고

Fabric 관리에 대한 자세한 내용은 Microsoft Fabric 관리자란?을 참조하세요.

Fabric 테넌트는 기본적으로 Microsoft Purview Information Protection과 통합됩니다. Fabric은 Microsoft Purview Information Protection의 민감도 레이블을 사용하여 조직이 수집에서 내보내기까지 중요한 데이터를 분류하고 보호하는 데 도움이 됩니다.