Обновление Хранилище BLOB-объектов Azure с помощью возможностей Azure Data Lake Storage
Эта статья поможет вам активировать иерархическое пространство имен и разблокировать такие возможности, как безопасность на уровне файлов и каталогов, а также ускорить работу. Эти возможности широко используются рабочими нагрузками аналитики больших данных и называются azure Data Lake Storage совместно.
Дополнительные сведения об этих возможностях и оценке влияния этого обновления на рабочие нагрузки, приложения, затраты, интеграцию служб, средства, функции и документацию см. в статье об обновлении Хранилище BLOB-объектов Azure с помощью возможностей Azure Data Lake Storage.
Внимание
Обновление является односторонним. После обновления отменить изменения учетной записи невозможно. Рекомендуется проверить обновление в непроизводственной среде.
Подготовка к обновлению
Чтобы подготовиться к обновлению учетной записи хранения до Data Lake Storage:
Просмотр поддержки функций
Учетная запись хранения может быть настроена для использования функций, которые еще не поддерживаются в учетных записях с поддержкой Data Lake Storage. Если ваша учетная запись использует такие функции, обновление не пройдет этап проверки. Чтобы определить, какие функции не поддерживаются, ознакомьтесь со статьей Поддержка функции хранилища Blob-объектов в учетных записях хранилища Azure. Если вы используете такие функции в учетной записи, отключите их перед началом обновления.
Следующие функции поддерживаются для учетных записей Data Lake Storage, но не поддерживаются процессом обновления:
- Моментальные снимки BLOB-объектов
- Области шифрования
- Неизменяемое хранилище
- Отслеживание времени последнего доступа для управления жизненным циклом
- Обратимое удаление BLOB-объектов
- Обратимое удаление для контейнеров
Если у вашей учетной записи хранения есть такие функции, их необходимо отключить перед выполнением обновления. Если вы хотите возобновить использование функций после завершения обновления, повторно включите их.
В некоторых случаях необходимо разрешить время для операций очистки после отключения функции перед обновлением. Одним из примеров является функция обратимого удаления BLOB-объектов. Перед обновлением учетной записи необходимо отключить обратимое удаление большого двоичного объекта, а затем разрешить срок действия всех blob-объектов обратимого удаления.
Внимание
Вы не можете обновить учетную запись хранения до Data Lake Storage, которая когда-либо включила функцию канала изменений. Простое отключение канала изменений не позволит выполнить обновление. Вместо этого необходимо создать учетную запись с включенным функцией иерархического пространства имен, а затем переместить данные в эту учетную запись.
Удаление страничных BLOB-объектов из учетной записи хранения
Невозможно обновить учетную запись хранения, содержащую страничные BLOB-объекты. Перед обновлением удалите страничные BLOB-объекты из учетной записи хранения.
Убедитесь, что сегменты каждого пути большого двоичного объекта именуются
Процесс миграции создает каталог для каждого сегмента пути большого двоичного объекта. Каталоги Data Lake Storage должны иметь имя, поэтому для успешной миграции каждый сегмент пути в виртуальном каталоге должен иметь имя. То же требование верно для сегментов, которые именуются только пробелом. Если какие-либо сегменты пути либо неименованы (//
) или именованы только с символом пробела (_
), то перед продолжением миграции необходимо скопировать эти большие двоичные объекты в новый путь, совместимый с этими требованиями именования.
Запрет действия записи в учетную запись хранения
Обновление может завершиться ошибкой, если приложение записывает в учетную запись хранения во время обновления. Чтобы предотвратить такое действие записи, выполните следующие действия:
Выключает любые приложения или службы, которые могут выполнять операции записи.
Выпуск или прерывание существующих аренд на контейнерах и больших двоичных объектах в учетной записи хранения.
После завершения обновления разорвать созданные аренды, чтобы возобновить запись доступа к контейнерам и blob-объектам.
Предупреждение
Нарушение активной аренды без корректного отключения приложений или виртуальных машин, которые в настоящее время обращаются к этим ресурсам, могут иметь непредвиденные результаты. Перед нарушением текущей аренды не забудьте выполнить все текущие действия записи.
Выполнение обновления
Чтобы начать, войдите на портал Azure.
Найдите учетную запись хранения и отобразите общие сведения о ней.
Выберите миграцию Data Lake 2-го поколения.
Открывается страница конфигурации Обновление до учетной записи хранения с возможностями Azure Data Lake 2-го поколения
Разверните раздел Шаг 1: Проверка изменений учетной записи перед обновлением и щелкните Просмотреть и принять изменения.
На странице Просмотреть изменения учетной записи поставьте флажок и щелкните Принять изменения.
Разверните раздел Шаг 2: Проверка учетной записи перед обновлением и щелкните Начать проверку.
Если проверка не пройдена, на странице появится сообщение об ошибке. В некоторых случаях появляется ссылка Просмотр ошибок. Если ссылка появится, выберите ее.
Потом из контекстного меню файла error.json выберите Скачивание.
Откройте скачанный файл, чтобы определить, почему учетная запись не прошла этап проверки. Следующая функция JSON указывает на то, что в учетной записи активирована несовместимая функция. В этом случае нужно отключить эту функцию, а затем снова начать проверку.
{ "startTime": "2021-08-04T18:40:31.8465320Z", "id": "45c84a6d-6746-4142-8130-5ae9cfe013a0", "incompatibleFeatures": [ "Blob Delete Retention Enabled" ], "blobValidationErrors": [], "scannedBlobCount": 0, "invalidBlobCount": 0, "endTime": "2021-08-04T18:40:34.9371480Z" }
После успешной проверки вашей учетной записи разверните раздел Шаг 3: Обновить учетную запись, потом нажмите Начать обновление.
Внимание
Во время обновления учетной записи операции записи будут отключены. Операции чтения не отключаются, но мы настоятельно рекомендуем приостановить операции чтения, так как они могут дестабилизировать процесс обновления.
После успешного завершения миграции появится сообщение, аналогичное следующему.
Остановка обновления
Миграцию можно остановить до ее завершения.
Чтобы остановить процесс обновления, прежде чем он закончится, выберите Отменить обновление.
Перенос данных, рабочих нагрузок и приложений
Конфигурируйте службы в рабочих нагрузках, чтобы выбрать либо конечную точку службы BLOB-объектов, либо конечную точку хранилища Data Lake.
Для рабочих нагрузок Hadoop, которые используют драйвер Windows Azure Storage Blob или драйвер WASB проверьте, чтобы они были модифицированы до использования драйвера Azure Blob File System (ABFS). В отличие от драйвера WASB, который направляет запросы в конечную точку службы BLOB-объектов, драйвер ABFS направляет запросы в конечную точку Data Lake Storage вашей учетной записи.
Протестируйте пользовательские приложения, чтобы убедиться, что они работают с обновленной учетной записью так, как ожидалось.
Доступ к Data Lake Storage с использованием нескольких протоколов позволяет большинству приложений продолжать пользоваться API BLOB-объектов без их модификации. Если возникают проблемы или вы хотите использовать API для работы с операциями каталогов и списками управления доступом, рассмотрите возможность перемещения некоторых кодов для использования API Data Lake Storage. См. руководства по .NET, Java, Python, Node.js и REST.
Протестируйте пользовательские сценарии, чтобы убедиться, что они работают с обновленной учетной записью так, как ожидалось.
Как и в случае с API для BLOB-объектов, многие сценарии, скорее всего, будут работать без необходимости изменять их. Однако при необходимости можно обновить файлы скриптов для использования командлетов PowerShell Data Lake Storage и команд Azure CLI.