다음을 통해 공유


모듈 1: Data Factory를 사용하여 파이프라인 만들기

이 모듈은 파이프라인의 복사 작업 사용하여 원본 저장소에서 데이터 레이크하우스의 Bronze 테이블로 원시 데이터를 수집하는 데 10분이 걸립니다.

모듈 1의 개략적인 단계는 다음과 같습니다.

  1. 데이터 파이프라인 만들기.
  2. 파이프라인의 복사 작업을 사용하여 데이터 레이크하우스에 샘플 데이터를 로드합니다.

데이터 파이프라인 만들기

  1. 활성 구독이 있는 Microsoft Fabric 테넌넌트 계정이 필요합니다. 무료 계정을 만듭니다.

  2. Microsoft Fabric 사용 작업 영역: 작업 영역 만들기가 있는지 확인합니다.

  3. Power BI에 로그인합니다.

  4. 화면 왼쪽 아래에서 기본 Power BI 아이콘을 선택하고 Fabric선택합니다.

    Data Factory 환경의 선택을 보여 주는 스크린샷.

  5. 작업 영역 탭에서 작업 영역을 선택한 다음, + 새 항목선택하고 데이터 파이프라인 선택합니다. 파이프라인 이름을 제공합니다. 다음으로 만들기를 선택합니다.

    새 데이터 파이프라인을 만드는 버튼이 선택된 Data Factory 시작 페이지의 스크린샷.

    새 파이프라인에 이름을 지정하는 대화 상자를 보여 주는 스크린샷.

파이프라인의 복사 작업 사용하여 데이터 레이크하우스에 샘플 데이터 로드

1단계: 복사 도우미를 사용하여 복사 작업을 구성합니다.

복사 데이터 도우미를 선택하여 복사 도우미 도구를 엽니다.

새 파이프라인 시작 페이지에서 데이터 복사 작업의 선택을 보여 주는 스크린샷.

2단계: 복사 도우미에서 설정을 구성합니다.

  1. 데이터 복사 대화 상자가 첫 번째 단계인 데이터 원본 선택과 함께 표시됩니다. 대화 상자 맨 위에 있는 옵션에서 샘플 데이터을 선택한 다음, NYC 택시 - 녹색을 선택합니다.

    데이터 원본 선택 탭에서 NYC Taxi - Green 데이터를 복사 도우미로 선택한 것을 보여주는 스크린샷.

  2. 데이터 원본 미리 보기가 다음으로 데이터 원본 페이지에 나타납니다. 검토한 다음 선택합니다.

    NYC Taxi - 녹색 샘플 데이터 세트의 미리 보기 데이터를 보여 주는 스크린샷

  3. 복사 도우미의 데이터 대상 선택 단계에서 레이크하우스를 선택한 다음, 다음을 선택합니다.

    데이터 복사 도우미의 데이터 대상 선택 탭에 있는 레이크하우스 대상의 선택을 보여 주는 스크린샷.

  4. 표시되는 데이터 대상 구성 페이지에서 새 레이크하우스 만들기를 선택하고 새 레이크하우스의 이름을 입력합니다. 다음을 다시 선택합니다.

    새 레이크하우스 만들기 옵션을 선택하고 레이크하우스 이름을 제공하는 복사 도우미의 데이터 대상 구성 페이지를 보여 주는 스크린샷.

  5. 이제 선택에서 레이크하우스 대상의 세부 정보를 구성하고 폴더 경로 또는 테이블 페이지에 매핑합니다. 루트 폴더에 대한 테이블을 선택하고, 테이블 이름을 제공하고, 덮어쓰기 작업을 선택합니다. 테이블 덮어쓰기 작업을 선택한 후에 나타나는 파티션 사용 확인란을 선택하지 마세요.

    선택 및 폴더 경로 또는 테이블 단계에 매핑된 데이터 복사 도우미의 데이터 대상에 연결 탭을 보여 주는 스크린샷.

  6. 마지막으로 복사 데이터 도우미의 검토 + 저장 페이지에서 구성을 검토합니다. 이 자습서에서는 다음 단계에서 작업을 수동으로 실행하므로 데이터 전송 즉시 시작 확인란의 선택을 취소합니다. 그런 다음 확인을 선택합니다.

    검토 + 저장 페이지의 데이터 복사 도우미를 보여 주는 스크린샷.

3단계: 복사 작업 결과를 실행하고 확인합니다.

  1. 파이프라인 편집기에서 실행 탭을 선택합니다. 그런 다음 실행 버튼을 선택한 다음, 프롬프트에서 저장하고 실행하여 복사 작업 실행합니다.

    실행 버튼이 강조 표시된 파이프라인 실행 탭을 보여 주는 스크린샷.

    저장 및 실행 버튼이 강조 표시된 저장 및 실행 대화 상자를 보여 주는 스크린샷.

  2. 실행을 모니터링하고 파이프라인 캔버스 아래의 출력 탭에서 결과를 확인할 수 있습니다. 실행 세부 정보 단추(실행 중인 파이프라인 실행을 마우스로 가리키면 나타나는 "안경" 아이콘)를 선택하여 실행 세부 정보를 봅니다.

    파이프라인 출력 탭의 실행 세부 정보 버튼을 보여 주는 스크린샷.

  3. 실행 세부 정보에는 읽고 쓴 1,508,501개의 행이 표시됩니다.

    파이프라인 실행에 대한 데이터 복사 세부 정보의 스크린샷.

  4. 기간 분석 구역을 확장하여 복사 작업 각 단계의 기간을 확인합니다. 복사 세부 정보를 검토한 후 닫기를 선택합니다.

    복사 작업 실행의 기간 분석을 보여 주는 스크린샷.

Microsoft Fabric에서 Data Factory를 사용하여 첫 번째 데이터 통합을 위한 엔드 투 엔드 자습서의 첫 번째 모듈에서는 다음 방법을 알아보았습니다.

  • 데이터 파이프라인 만들기.
  • 파이프라인에 데이터 흐름 복사 작업 추가.
  • 샘플 데이터를 사용하고 Data 레이크하우스를 만들어 새 테이블에 데이터를 저장합니다.
  • 파이프라인을 실행하고 세부 정보 및 기간 분석을 확인합니다.

이제 다음 구역으로 이동하여 데이터 흐름을 만듭니다.