Поделиться через


Копирование из Хранилище BLOB-объектов Azure в Lakehouse

В этом руководстве вы создадите конвейер данных для перемещения CSV-файла из входной папки источника Хранилище BLOB-объектов Azure в место назначения Lakehouse.

Необходимые компоненты

Чтобы приступить к работе, необходимо выполнить следующие предварительные требования:

  • Убедитесь, что у вас есть рабочая область с поддержкой Project Microsoft Fabric: создайте рабочую область.

  • Нажмите кнопку "Попробовать сейчас!", чтобы подготовить источник данных Хранилище BLOB-объектов Azure копии. Создайте новую группу ресурсов для этой Хранилище BLOB-объектов Azure и выберите "Проверить и создать".>

    Снимок экрана: экран сведений о проекте.

    Затем создается Хранилище BLOB-объектов Azure и moviesDB2.csv отправляется в входную папку созданного Хранилище BLOB-объектов Azure.

    Снимок экрана: расположение нового хранилища в папке.

Создание конвейера данных

  1. Перейдите на фабрику данных на странице app.powerbi.com.

  2. Создайте рабочую область для этой демонстрации.

    Снимок экрана: экран рабочей области.

  3. Выберите "Создать" и выберите " Конвейер данных".

    Снимок экрана: меню

Копирование данных с помощью помощника по копированию

В этом сеансе вы начнете создавать конвейер данных, выполнив следующие действия. Эти действия копируют CSV-файл из входной папки Хранилище BLOB-объектов Azure в место назначения Lakehouse с помощью помощника по копированию.

Шаг 1. Начало работы с помощником по копированию

  1. Выберите помощник по копированию данных на холсте, чтобы открыть средство помощника по копированию, чтобы приступить к работе. Или выберите "Использовать помощник по копированию" в раскрывающемся списке "Копирование данных " на вкладке "Действия " на ленте.

    Снимок экрана: два варианта выбора помощника по копированию.

Шаг 2. Настройка источника

  1. Введите большой двоичный объект в фильтре выбора, а затем выберите "Большие двоичные объекты Azure" и нажмите кнопку "Далее".

    Снимок экрана: выбор Хранилище BLOB-объектов Azure в качестве источника данных.

  2. Укажите имя учетной записи или URL-адрес и создайте подключение к источнику данных, выбрав в раскрывающемся списке "Создать новое подключение".

    Снимок экрана: место для выбора нового подключения.

    1. Выбрав "Создать новое подключение" с указанной учетной записью хранения, необходимо заполнить только тип проверки подлинности. В этой демонстрации мы выбираем ключ учетной записи, но вы можете выбрать другой тип проверки подлинности в зависимости от вашего предпочтения.

      Снимок экрана: экран подключения к источнику данных помощника по копированию данных.

    2. После успешного создания подключения необходимо только выбрать "Далее" для подключения к источнику данных.

  3. Выберите файл moviesDB2.csv в исходной конфигурации для предварительной версии, а затем нажмите кнопку "Далее".

    Снимок экрана: выбор источника данных.

Шаг 3. Настройка назначения

  1. Выберите Lakehouse.

    Снимок экрана: диалоговое окно

  2. Укажите имя нового Lakehouse. Затем нажмите кнопку "Создать" и подключиться.

    Снимок экрана: диалоговое окно

  3. Настройте и сопоставите исходные данные с назначением; затем нажмите кнопку "Далее ", чтобы завершить конфигурации назначения.

    Снимок экрана: диалоговое окно

Шаг 4. Просмотр и создание действия копирования

  1. Просмотрите параметры действия копирования на предыдущих шагах и нажмите кнопку "Сохранить и запустить ", чтобы завершить работу. Вы также можете вернуться к предыдущим шагам, чтобы изменить параметры при необходимости в средстве.

    Снимок экрана: просмотр и создание экрана в диалоговом окне помощника по копированию данных.

  2. После завершения действие копирования добавляется на холст конвейера данных и выполняется непосредственно, если вы оставили флажок "Запустить передачу данных".

    Снимок экрана: завершенная действие Copy.

Запуск и планирование конвейера данных

  1. Если вы не оставили флажок "Начать передачу данных" на странице "Просмотр и создание", перейдите на вкладку "Главная" и нажмите кнопку "Выполнить". Затем нажмите кнопку "Сохранить и запустить".

    Снимок экрана: кнопка запуска действие Copy на вкладке

    Снимок экрана: диалоговое окно

  2. На вкладке "Выходные данные" выберите ссылку с именем действие Copy, чтобы отслеживать ход выполнения и проверять результаты выполнения.

    Снимок экрана: кнопка

  3. В диалоговом окне "Копирование данных" отображаются результаты выполнения, включая состояние, объем данных, чтение и запись, время запуска и остановки, а также длительность.

    Снимок экрана: диалоговое окно

  4. Вы также можете запланировать выполнение конвейера с определенной частотой по мере необходимости. В следующем примере показано, как запланировать выполнение конвейера каждые 15 минут.

    Снимок экрана: диалоговое окно настройки расписания.

    Снимок экрана: конвейер с настроенным расписанием для выполнения каждые 15 минут.

Конвейер в этом примере показывает, как скопировать данные из Хранилище BLOB-объектов Azure в Lakehouse. Вы научились выполнять следующие задачи:

  • Создайте конвейер данных.
  • Скопируйте данные с помощью помощника по копированию.
  • Запустите и запланируйте конвейер данных.

Затем перейдите к дополнительным сведениям о мониторинге выполнения конвейера.