Поделиться через


Модуль 1. Создание конвейера с помощью фабрики данных

Этот модуль занимает 10 минут, принимая необработанные данные из исходного хранилища в бронзовую таблицу data Lakehouse с помощью действия копирования в конвейере.

Высокоуровневые шаги в модуле 1 приведены следующим образом:

  1. Создайте конвейер данных.
  2. Используйте действие копирования в конвейере для загрузки примеров данных в Data Lakehouse.

Создание конвейера данных

  1. Требуется учетная запись клиента Microsoft Fabric с активной подпиской. Создайте бесплатную учетную запись.

  2. Убедитесь, что у вас есть рабочая область с поддержкой Microsoft Fabric: создать рабочую область.

  3. Войдите в Power BI.

  4. Нажмите значок Power BI в левом нижнем углу экрана и переключитесь на режим Data Factory.

    снимок экрана, показывающий выбор интерфейса фабрики данных.

  5. Выберите конвейер данных и укажите имя конвейера. Затем выберите Создать.

    снимок экрана начальной страницы фабрики данных с кнопкой, чтобы создать выбранный конвейер данных.

    снимок экрана, показывающий диалоговое окно, чтобы указать новое имя конвейера.

Используйте действие Copy в конвейере для загрузки примеров данных в Data Lakehouse

Шаг 1. Используйте помощник по копированию для настройки действия копирования.

Выберите помощник по копированию данных , чтобы открыть средство помощника по копированию.

Снимок экрана, показывающий выбор действия

Шаг 2. Настройка параметров в помощнике по копированию.

  1. Диалоговое окно Копирование данных отображается с первым шагом, Выбор источника данных, выделенным. Выберите Примеры данных из параметров в верхней части диалогового окна, а затем выберите Нью-Йоркское зелёное такси.

    снимок экрана: выбор NYC Taxi — зеленые данные в помощнике по копированию на вкладке

  2. Предварительный просмотр источника данных появится на странице Подключение к источнику данных. Проверьте и выберите Далее.

    снимок экрана: предварительный просмотр данных для набора данных такси Нью-Йорка — зеленый набор данных.

  3. Чтобы выбрать назначение данных помощника по копированию, выберите Lakehouse, а затем Далее.

    снимок экрана, отображающий выбор пункта назначения Lakehouse на вкладке

  4. Выберите Создать новый Lakehouse на странице конфигурации назначения данных, которая появится, и введите имя для нового Lakehouse. Затем снова нажмите кнопку Далее.

    скриншот, показывающий страницу конфигурации назначения данных в помощнике по копированию, с выбором опции

  5. Теперь настройте сведения о назначении Lakehouse на странице Выберите и сопоставьте с путем к папке или таблице. Выберите таблицы для корневой папки , укажите имя таблицы и выберите действие Перезаписать. Не устанавливайте флажок Включить раздел, который появляется после выбора действия таблицы Overwrite.

    снимок экрана, на котором показана вкладка

  6. Наконец, на странице Проверка и сохранение помощника по копированию данных просмотрите конфигурацию. В этом руководстве снимите флажок Начать передачу данных сразу же, так как мы запускаем действие вручную на следующем шаге. Затем выберите ОК.

    снимок экрана: помощник по копированию данных на странице проверки и сохранения.

Шаг 3. Запустите и просмотрите результаты действия копирования.

  1. В редакторе конвейера выберите вкладку "Запуск". Затем нажмите кнопку запуска , а затем Сохранить и запустить в запросе, чтобы запустить действие копирования.

    снимок экрана: вкладка

    снимок экрана: диалоговое окно

  2. Вы можете отслеживать выполнение и проверять результаты на вкладке выходных данных под холстом конвейера. Нажмите кнопку для просмотра сведений о выполнении (значок в виде очков, который отображается при наведении указателя мыши на запущенный конвейер), чтобы просмотреть сведения о выполнении.

    снимок экрана: кнопка

  3. Подробности выполнения показывают, что считано и записано 1 508 501 строк.

    Снимок экрана сведений о копировании данных для запуска конвейера.

  4. Разверните раздел разбивки по длительности, чтобы увидеть продолжительность каждого этапа процесса копирования. После просмотра сведений о копировании выберите Закрыть.

    снимок экрана, показывающий длительность выполнения действия копирования.

В этом первом модуле нашего комплексного руководства для первой интеграции данных с помощью Data Factory в Microsoft Fabric вы узнали, как:

  • Создайте конвейер данных.
  • Добавьте действие "Копирование" в ваш конвейер.
  • Используйте примеры данных и создайте data Lakehouse для хранения данных в новой таблице.
  • Запустите конвейер и просмотрите его подробности и распределение по времени.

Перейдите к следующему разделу, чтобы создать поток данных.