Поделиться через


2019 июня

Эти функции и доработки платформы Azure Databricks были выпущены в июне 2019 г.

Примечание.

Выпуски являются поэтапными. На обновление вашей учетной записи Azure Databricks может потребоваться до одной недели с даты выпуска.

Поддержка экземпляра Lsv2 теперь общедоступна

24-26 июня 2019 г.: версия 2.100

Azure Databricks теперь предоставляет полную поддержку для серии виртуальных машин Lsv2 для рабочих нагрузок с высокой пропускной способностью и большим числом операций ввода-вывода в секунду.

Интеграция RStudio больше не ограничивается кластерами с высоким уровнем параллелизма

6-11 июня 2019 г.: версия 2.99

Теперь можно включить RStudio Server на стандартных кластерах Azure Databricks в дополнение к уже поддерживаемым кластерам с высоким уровнем параллелизма. Независимо от режима кластера, для интеграции с сервером RStudio будет требоваться отключение автоматического завершения работы кластера. См. раздел RStudio в Azure Databricks.

MLflow 1.0

3 июня 2019 г.

MLflow — это платформа с открытым кодом для управления полным жизненным циклом машинного обучения. С помощью MLflow специалисты по обработке и анализу данных могут выполнять эксперименты локально или в облаке, упаковывать и совместно использовать модели на разных платформах, а также развертывать модели практически в любом месте.

Мы рады сообщить о сегодняшнем выпуске MLflow 1.0. В выпуске 1.0 не только повышен уровень зрелости и стабильности API, но также добавлен ряд часто запрашиваемых функций и усовершенствований:

  • Интерфейс командной строки реорганизован и теперь содержит специализированные команды для артефактов, моделей, баз данных и сервера отслеживания.
  • Поиск по серверу отслеживания поддерживает упрощенную версию предложения SQL WHERE. Помимо поддержки метрик и параметров выполнения, поиск также усовершенствован для поддержки ряда атрибутов выполнения и пользовательских и системных тегов.
  • Добавляет поддержку координат x в API отслеживания. Компоненты визуализации пользовательского интерфейса MLflow теперь также поддерживают отображение метрик построения для предоставленных значений координат x.
  • Добавляет конечную точку REST API runs/log-batch, а также методы Python, R и Java для регистрации в журнале нескольких метрик, параметров и тегов с помощью одного запроса API.
  • В Windows для отслеживания теперь поддерживается клиент MLflow 1.0.
  • Добавляет поддержку HDFS в качестве серверной части хранилища артефактов.
  • Добавляет команду для создания контейнера Docker, в котором точка входа по умолчанию обслуживает указанную модель функции Python MLflow по порту 8080 в контейнере.
  • Добавляет экспериментальную конфигурацию модели ONNX.

Полный список изменений можно просмотреть в журнале изменений MLflow.

Databricks Runtime 5.4 для Машинного обучения

3 июня 2019 г.

Databricks Runtime 5.4 ML построен на основе Databricks Runtime 5.4 (EoS). Эта версия содержит множество популярных библиотек машинного обучения, включая TensorFlow, PyTorch, keras и XGBoost, а также распределенное обучение TensorFlow с помощью Horovod.

Она включает приведенные ниже новые функции.

  • Интеграция MLlib с MLflow (общедоступная предварительная версия).
  • Hyperopt с предварительно установленным новым классом SparkTrials (общедоступная предварительная версия).
  • Выходные данные HorovodRunner, отправленные из Horovod на узел драйвера Spark, теперь отображаются в ячейках записной книжки.
  • Предварительно установлен пакет Python для XGBoost.

Дополнительные сведения см. в разделе Databricks Runtime 5.4 для машинного обучения (EoS).

Databricks Runtime 5.4

3 июня 2019 г.

Теперь доступна версия Databricks Runtime 5.4. Databricks Runtime 5.4 включает Apache Spark 2.4.2, обновленные библиотеки Python, R, Java и Scala, а также следующие новые функции:

  • Delta Lake в Databricks теперь включает автоматическую оптимизацию (общедоступная предварительная версия)
  • Использование выбранной среды IDE и сервера ноутбуков с Databricks Connect
  • Программы библиотек общедоступны
  • Источник данных двоичных файлов

Дополнительные сведения см. в разделе Databricks Runtime 5.4 (EoS).