Поделиться через


Получение данных из хранилища Azure

Прием данных — это процесс, используемый для загрузки данных из одного или нескольких источников в таблицу в Azure Data Explorer. После принятия данные становятся доступными для запроса. В этой статье вы узнаете, как получить данные из хранилища Azure (контейнер ADLS 2-го поколения, контейнер BLOB-объектов или отдельные BLOB-объекты) в новую или существующую таблицу.

Загрузка данных из учетной записи хранения Azure является однократной операцией. Сведения о непрерывном приеме данных см. в разделе Настройка приема потоковой передачи.

Общие сведения о приеме данных см. в обзоре приема данных в Azure Data Explorer.

Необходимые компоненты

Получить данные

  1. В меню слева выберите "Запрос".

  2. Щелкните правой кнопкой мыши базу данных, в которой необходимо принять данные. Выберите Получить данные.

    Снимок экрана: вкладка запроса с правой кнопкой мыши на базе данных и откроется диалоговое окно

Исходный код

В окне "Получение данных" выбрана вкладка "Источник".

Выберите источник данных из доступного списка. В этом примере вы используете данные из хранилища Azure.

Снимок экрана: окно получения данных с выбранной вкладкой источника.

Настройка

  1. Выберите целевую базу данных и таблицу. Если вы хотите принять данные в новую таблицу, нажмите кнопку +Создать таблицу и введите имя таблицы.

    Примечание.

    Имена таблиц могут содержать до 1024 символов, включая пробелы, буквенно-цифровые символы, дефисы и символы подчеркивания. Специальные символы не поддерживаются.

  2. Чтобы добавить источник, выберите " Выбрать контейнер " или "Добавить URI".

    1. Если выбран контейнер Select, заполните следующие поля:

      Снимок экрана: вкладка

      Параметр Описание поля
      Отток подписок Идентификатор подписки, в которой находится учетная запись хранения.
      Storage account Имя, определяющее учетную запись хранения.
      Контейнер Контейнер хранилища, который требуется принять.
      Фильтры файлов (необязательно)
      Folder path Фильтрует данные для приема файлов с определенным путем к папке.
      Расширение файла Фильтрует данные для приема файлов только с определенным расширением файла.
    2. Если вы выбрали "Добавить URI"из учетной записи хранения, создайте URL-адрес SAS для контейнера или отдельных блоков данных (blobs), которые вы хотите загрузить. Задайте разрешения для чтения и списка для контейнеров или чтения для отдельных BLOB-объектов. Дополнительные сведения см. в статье Создание маркера SAS.

      1. Вставьте URL-адрес в поле URI, а затем выберите "плюс" (+). Можно добавить несколько URI для отдельных блобов или один URI для контейнера.

      Снимок экрана: вкладка

      Примечание.

      • Вы можете добавить до 10 отдельных BLOB-объектов. Каждый большой двоичный объект может быть максимум 1 ГБ без сжатия.
      • Вы можете принять до 5000 больших двоичных объектов из одного контейнера.
      • Вы не можете получать отдельные большие двоичные объекты и контейнеры в одном приеме.
  3. Выберите Далее

Проверка

Откроется вкладка "Проверка " с предварительным просмотром данных.

Чтобы завершить процесс приема, нажмите кнопку Готово.

Снимок экрана: вкладка

Необязательно.

Изменить столбцы

Примечание.

  • Для табличных форматов (CSV, TSV, PSV) невозможно сопоставить столбец дважды. Чтобы сопоставить существующий столбец, сначала удалите новый столбец.
  • Нельзя изменить тип существующего столбца. При попытке выполнить сопоставление для столбца, имеющего другой формат, могут отобразиться пустые столбцы.

Изменения, которые вы можете внести в таблицу, зависят от следующих параметров:

  • Тип таблицы — новая или существующая.
  • Тип сопоставления — новое или существующее.
Тип таблицы Тип сопоставления Доступные корректировки
Новая таблица Создать сопоставление Переименование столбца, изменение типа данных, изменение источника данных, преобразование сопоставления, добавление столбца, удаление столбца
Существующая таблица Создать сопоставление Добавьте столбец (в котором можно изменить тип данных, переименовать и обновить)
Существующая таблица Существующее сопоставление ничего

Снимок экрана: столбцы, открытые для редактирования.

Преобразования сопоставлений

Некоторые сопоставления форматов данных (Parquet, JSON и Avro) поддерживают простые преобразования во время приема. Чтобы применить преобразования сопоставления, создайте или обновите столбец в окне "Изменение столбцов ".

Преобразования сопоставления можно выполнять в столбце строки типа или даты и времени с источником с типом данных int или long. Поддерживаются следующие преобразования сопоставлений:

  • DateTimeFromUnixSeconds;
  • DateTimeFromUnixMilliseconds;
  • DateTimeFromUnixMicroseconds;
  • DateTimeFromUnixNanoseconds.

Дополнительные параметры на основе типа данных

Табличные (CSV, TSV, PSV):

  • Если вы используете табличные форматы в существующей таблице, можно выбрать расширеннуюсхему текущей >. Табличные данные не обязательно включают имена столбцов, которые используются для сопоставления исходных данных с существующими столбцами. При проверке этого параметра сопоставление выполняется по порядку, а схема таблицы остается той же. Если этот параметр снят, для входящих данных создаются новые столбцы независимо от структуры данных.

  • Чтобы использовать первую строку в качестве имен столбцов, выберите "Дополнительно>первая строка" — заголовок столбца.

    Снимок экрана: расширенные параметры CSV.

JSON:

  • Чтобы определить деление данных JSON, выберите расширенные>вложенные уровни от 1 до 100.

  • Если выбраны ошибки расширенного>формата пропуска данных, данные будут приема в формате JSON. Если этот флажок не выбран, данные будут приема в формате multijson.

    Снимок экрана: расширенные параметры JSON.

Итоги

В окне подготовки данных все три шага помечаются зелеными флажками при успешном завершении приема данных. Вы можете просмотреть команды, которые использовались для каждого шага, или выбрать карточку для запроса, визуализации или удаления данных приема.

Снимок экрана: страница сводки с успешно завершенным приемом.