Поделиться через


Руководство по Lakehouse: прием данных в lakehouse

В этом руководстве вы используете более мерные и фактические таблицы из широкой мировой импортеров (WWI) в лейкхаус.

Необходимые компоненты

Прием данных

В этом разделе описано, как использовать действие копирования данных конвейера Фабрики данных для приема примеров данных из учетной записи хранения Azure в раздел "Файлы " созданного ранее озера.

  1. Выберите рабочие области в области навигации слева и выберите новую рабочую область в меню "Рабочие области". Откроется представление элементов рабочей области.

  2. На ленте рабочей области выберите "+Создать" в конвейере данных.

    Снимок экрана: создание конвейера данных.

  3. В диалоговом окне "Создать конвейер" укажите имя в качестве IngestDataFromSourceToLakehouse и нажмите кнопку "Создать". Создается и открывается новый конвейер фабрики данных.

  4. Затем настройте HTTP-подключение для импорта примеров данных World Wide Imports в Lakehouse. В списке "Новые источники" выберите "Просмотреть больше", найдите http и выберите его.

    Снимок экрана, на котором показано, где выбрать источник HTTP.

  5. В окне "Подключение к источнику данных" введите сведения из приведенной ниже таблицы и нажмите кнопку "Далее".

    Свойство Значение
    URL https://assetsprod.microsoft.com/en-us/wwi-sample-dataset.zip
    Connection Создание нового подключения
    Имя подключения wwisampledata
    Шлюз данных нет
    Тип проверки подлинности Анонимные

    Снимок экрана: параметры для настройки http-подключения.

  6. На следующем шаге включите двоичную копию и выберите ZipDeflate (.zip) в качестве типа сжатия, так как источник является файлом .zip. Сохраните другие поля в значениях по умолчанию и нажмите кнопку "Далее".

    Снимок экрана: выбор типа сжатия.

  7. В окне "Подключение к данным" укажите корневую папку в качестве файлов и нажмите кнопку "Далее". При этом данные записываются в раздел "Файлы " в лейкхаусе.

    Снимок экрана: параметры подключения назначения озера.

  8. Выберите формат файла в качестве двоичного файла для назначения. Нажмите кнопку "Далее", а затем нажмите кнопку "Сохранить и запустить". Конвейеры можно запланировать периодические обновления данных. В этом руководстве мы запускаем конвейер только один раз. Процесс копирования данных занимает около 10–15 минут.

    Снимок экрана: формат целевого файла.

  9. Вы можете отслеживать выполнение конвейера и действие на вкладке "Выходные данные ". Вы также можете просмотреть подробные сведения о передаче данных, выбрав значок очков рядом с именем конвейера, который отображается при наведении указателя мыши на имя.

    Снимок экрана: состояние действия конвейера копирования.

  10. После успешного выполнения конвейера перейдите в lakehouse (wwilakehouse) и откройте обозреватель, чтобы просмотреть импортированные данные.

    Снимок экрана: переход к lakehouse.

  11. Убедитесь, что папка WideWorldImportersDW присутствует в представлении обозревателя и содержит данные для всех таблиц.

    Снимок экрана: исходные данные копируются в обозреватель Lakehouse.

  12. Данные создаются в разделе "Файлы " обозревателя lakehouse. Новая папка с GUID содержит все необходимые данные. Переименование GUID в wwi-raw-data

Чтобы загрузить добавочные данные в lakehouse, см . сведения о добавочной загрузке данных из хранилища данных в lakehouse.

Следующий шаг