다음을 통해 공유


Dataflow Gen1에서 Dataflow Gen2로 마이그레이션

이 문서에서는 Power BI 데이터 흐름 작성자를 대상으로 합니다. Microsoft Fabric용 Data Factory 데이터 흐름을 Dataflow Gen2로 마이그레이션하는 데 도움이 되는 지침과 근거를 제공합니다.

메모

데이터 흐름 Gen2는 새로운 기능과 향상된 환경을 제공하는 새로운 세대의 데이터 흐름입니다. Gen2 데이터 흐름은 Power BI 데이터 흐름과 함께 있으며, 이것은 현재 Dataflow Gen1으로 알려져 있습니다.

Dataflow Gen1과 Dataflow Gen2의 차이점을 이해하려면, "Dataflow Generation 1에서 Dataflow Generation 2로의 전환"이라는 문서를참조하세요.

배경

Microsoft Fabric은 셀프 서비스 및 IT 관리 엔터프라이즈 데이터를 위한 통합 플랫폼으로 발전했습니다. 데이터 볼륨과 복잡성이 기하급수적으로 증가함에 따라 Fabric 고객은 엔터프라이즈 솔루션의 규모를 확장하고, 안전하고, 관리하기 쉽고, 가장 큰 조직의 모든 사용자가 액세스할 수 있도록 요구합니다.

최근 몇 년 동안 Microsoft는 패브릭 용량에 확장 가능한 클라우드 기능을 제공하기 위해 큰 진전을 이루었습니다. 이를 위해 Fabric의 Data Factory는 수십 년 동안 구축된 데이터 통합 개발자 및 데이터 통합 솔루션의 대규모 에코시스템에 즉시 권한을 부여합니다. 이전 세대에서 사용할 수 있는 유사한 기능을 훨씬 뛰어넘는 전체 기능 집합을 활용합니다.

당연히 고객은 이제 Fabric 내에서 호스팅하여 데이터 통합 솔루션을 통합할 수 있는 기회가 있는지 묻고 있습니다. 그들은 종종 다음과 같은 질문을합니다.

  • Dataflow Gen2에서 사용하는 모든 데이터 흐름 기능이 작동하나요?
  • Dataflow Gen2에서만 사용할 수 있는 기능은 무엇인가요?
  • 기존 데이터 흐름을 Dataflow Gen2로 마이그레이션하려면 어떻게 해야 할까요?
  • 엔터프라이즈 데이터 수집을 위한 Microsoft의 로드맵은 무엇인가요?

이러한 많은 질문에 대한 답변은 이 문서에 설명되어 있습니다.

메모

패브릭 용량으로 마이그레이션하는 결정은 각 고객의 요구 사항에 따라 달라집니다. 고객은 정보에 입각한 결정을 내리기 위해 혜택을 신중하게 평가해야 합니다. 시간이 지남에 따라 Dataflow Gen2로의 유기적 마이그레이션이 예상되며, 고객이 편안하게 사용할 수 있는 측면에서 이 작업이 수행되기를 기대합니다.

명확히 하기 위해 현재 Power BI 데이터 흐름 또는 Power Platform 데이터 흐름을 더 이상 사용하지 않을 계획은 없습니다. 그러나 엔터프라이즈 데이터 수집을 위해 Dataflow Gen2에 대한 투자를 집중해야 하는 우선 순위가 있으므로 패브릭 용량에서 제공하는 값은 시간이 지남에 따라 증가합니다. Microsoft Fabric 용량을 선택하는 고객은 Microsoft Fabric 제품 로드맵에 맞춰 이점을 얻을 수 있습니다.

셀프 서비스 및 엔터프라이즈 데이터 통합의 수렴

Fabric에서 항목을 통합하면 리소스를 공동 배치하여 검색, 공동 작업 및 관리가 간소화됩니다. 이를 통해 중앙 IT 팀은 인기 있는 셀프 서비스 항목을 보다 쉽게 채택하고 통합할 수 있습니다. 동시에 데이터 계보 및 모니터링을 포함하여 회사 표준에 부합하는 중요 업무용 데이터 이동 및 변환 서비스를 운영할 수 있습니다.

Fabric의 Dataflow Gen2는 창작자들의 협업과 확장 가능한 요구를 지원하기 위해 빠른 복사기능을 도입했습니다. 이 기능은 Fabric의 백엔드 인프라를 활용하여 변환 과정 중에 발생하는 중간 데이터를 저장 및 처리함으로써, 대규모 데이터 볼륨을 효율적으로 입력할 수 있도록 합니다. 테라바이트 단위의 데이터를 원활하게 처리할 수 있습니다. 데이터 흐름 작성자는 패브릭 레이크하우스, 웨어하우스, 이벤트하우스 또는 Azure SQL Database와 같이 변환된 데이터에 데이터 대상을 지정하여 데이터 관리 및 접근성을 높일 수 있습니다. 또한 Copilot 통해 생성된 AI의 최근 통합은 지능형 코드 생성을 제공하고 반복적인 작업을 자동화하여 복잡한 솔루션을 만들기 위한 더 쉽고 빠른 경로를 제공하여 데이터 준비 환경을 향상시킵니다.

공통 플랫폼을 활용하여 워크플로가 간소화되어 비즈니스와 IT 간의 협업이 향상됩니다. 따라서 조직은 데이터 솔루션을 엔터프라이즈 수준으로 확장하여 방대한 양의 데이터를 관리하는 데 있어 고성능, 유연성 및 효율성을 보장할 수 있습니다.

패브릭 용량

분산 아키텍처 덕분에 패브릭 용량은 전체적인 부하, 일시적인 급증, 그리고 높은 동시성에 덜 민감합니다. 더 큰 패브릭 용량 SKU에 용량을 통합하면 고객은 향상된 성능과 처리량을 달성할 수 있습니다.

기능 비교

다음 표에서는 Power BI 데이터 흐름 및/또는 패브릭 데이터 흐름 Gen2에서 지원되는 기능을 제공합니다.

특징 Power BI 데이터 흐름 Gen1 패브릭 데이터 흐름 2세대
연결
모든 파워 쿼리 데이터 원본 지원
Power BI Desktop, Excel 또는 Power Apps에서 데이터 흐름에 연결하고 데이터를 로드합니다.
확장성
대규모 데이터 수집을 지원하는 빠른 복사는 데이터 흐름 내에서 데이터 파이프라인의 복사 작업을 활용합니다. 아니요
예약된 새로 고침 , 데이터가 최신 상태로 유지됨
증분 새로 고침 은 정책을 사용하여 증분 데이터 로드를 자동화하고거의 실시간으로 보고하는 데 도움이 됩니다.
데이터 파이프라인 오케스트레이션. 데이터 파이프라인에 데이터 흐름 작업 추가하고 오케스트레이션된 조건부 이벤트를 만들 수 있습니다. 아니요
인공 지능
데이터 쉽게 변환할 수 있도록 지능형 코드 생성을 제공하는 Data Factory의 Copilot는 복잡한 작업을 더 잘 이해하는 데 도움이 되는 코드 설명을 생성합니다. 아니요
Cognitive Services는 인공지능(AI)을 활용하여 Azure Cognitive Services의 다양한 알고리즘을 적용함으로써 셀프 서비스 데이터 준비를 강화합니다. 1 없음
AutoML(자동화된 기계 학습)- 비즈니스 분석가가 Fabric에서 직접 ML(기계 학습) 모델을 학습, 유효성 검사 및 호출할 수 있도록 합니다. 사용되지 않는 2
Azure Machine Learning 통합은 사용자가 파워 쿼리 편집기에서 호출할 수 있도록 사용자 지정 모델을 동적 파워 쿼리 함수로 노출합니다. 1 없음
콘텐츠 관리
사용자가 데이터 흐름 항목 종속성을 이해하고 평가하는 데 도움이 되는 데이터 계보 보기
배포 파이프라인은 패브릭 콘텐츠의 수명 주기를 관리합니다.
플랫폼 확장성 및 복원력
확장 및 성능 향상을 지원하는 프리미엄 용량 아키텍처
다국적 고객이 지역, 산업별 또는 조직 데이터 상주 요구 사항을 해결하는 데 도움이 되는 Multi-Geo 지원 3
보안
VNet(가상 네트워크) 데이터 게이트웨이 연결을 통해 패브릭이 조직의 가상 네트워크에서 원활하게 작동할 수 있습니다. 아니요
온-프레미스 데이터 게이트웨이의 연결은 조직의 온-프레미스 데이터 소스와 패브릭 간에 데이터를 안전하게 액세스할 수 있게 해줍니다.
Azure 서비스 태그의 지원 기능은 자동으로 관리되는 IP 주소 그룹으로, 네트워크 보안 규칙의 업데이트 및 변경 복잡성을 최소화하는 역할을 합니다.
지배 구조
콘텐츠 인증, 가치 있는 고품질의 패브릭 제품을 홍보하거나 인증합니다.
Microsoft Purview 통합 , 고객이 패브릭 항목을 관리하고 통제하는 데 도움이 됩니다.
MIP(Microsoft Information Protection)민감도 레이블 및 DLP(데이터 손실 방지)를 위한 Microsoft Defender for Cloud Apps 통합
모니터링 및 진단 로깅
향상된 새로 고침 기록. 이를 통해 데이터 흐름을 새로 고치는 동안 발생한 작업을 자세히 평가할 수 있습니다. 아니요
모니터링 허브은 패브릭 항목에 대한 모니터링 기능을 제공합니다. 아니요
패브릭 용량에 대한 모니터링 기능을 제공하는 Microsoft Fabric 용량 메트릭 앱
감사 로그 은 패브릭 및 Microsoft 365 전반에서 사용자 활동을 추적합니다.

1 Azure AI API 엔드포인트를 호출하는 사용자 지정 함수를 만드는 방법을 알아보려면 자습서: Power BI저장된 텍스트에서 핵심 구 추출을 참조하세요.

2 AutoML(자동화된 Machine Learning)은 더 이상 사용되지 않습니다. 자세한 내용은 이 공식 공지참조하세요.

3 Azure ADLS(Data Lake Storage) Gen2를 사용하도록 Power BI 데이터 흐름 스토리지를 구성하려면 이 문서참조하세요.

고려 사항

Dataflow Gen2로 마이그레이션하기 전에 계획에 고려해야 할 다른 고려 사항이 있습니다.

라이센스

Power BI 데이터 흐름(Dataflow Gen1)을 게시하거나 관리하려면 Pro 또는 PPU(사용자 단위 Premium) 라이선스가 필요합니다. 반면 프리미엄 용량 작업 영역에서 Dataflow Gen2를 작성하려면 Microsoft Fabric(무료) 라이선스만 필요합니다.

마이그레이션 시나리오

데이터 흐름을 마이그레이션할 때는 단순히 기존 솔루션을 복사하는 것 이상으로 생각하는 것이 중요합니다. 대신 Dataflow Gen2의 최신 혁신 및 기능을 활용하여 솔루션을 현대화하는 것이 좋습니다. 이 접근 방식은 솔루션이 비즈니스의 증가하는 요구를 지원할 수 있도록 합니다.

마이그레이션 시나리오 기사에서는 업그레이드, 재고 조사, 그리고 파워 쿼리 템플릿 같은 가속기 사용을 위한 여러 가지 방법을 설명합니다. 이러한 방법은 프로젝트에 대한 원활한 업그레이드를 보장하는 데 도움이 될 수 있습니다.

로드맵

Microsoft Fabric 릴리스 계획 은 Microsoft Fabric의 Data Factory에서의 새로운 기능과 계획된 기능을 포함하여, 향후 릴리스에 대비한 기능 준비에 따라 최신 업데이트 및 타임라인을 발표합니다.

이 문서에 대한 자세한 내용은 다음 리소스를 확인하세요.