2019 июня
Эти функции и доработки платформы Azure Databricks были выпущены в июне 2019 г.
Примечание.
Выпуски являются поэтапными. На обновление вашей учетной записи Azure Databricks может потребоваться до одной недели с даты выпуска.
Поддержка экземпляра Lsv2 теперь общедоступна
24-26 июня 2019 г.: версия 2.100
Azure Databricks теперь предоставляет полную поддержку для серии виртуальных машин Lsv2 для рабочих нагрузок с высокой пропускной способностью и большим числом операций ввода-вывода в секунду.
Интеграция RStudio больше не ограничивается кластерами с высоким уровнем параллелизма
6-11 июня 2019 г.: версия 2.99
Теперь можно включить RStudio Server на стандартных кластерах Azure Databricks в дополнение к уже поддерживаемым кластерам с высоким уровнем параллелизма. Независимо от режима кластера, для интеграции с сервером RStudio будет требоваться отключение автоматического завершения работы кластера. См. раздел RStudio в Azure Databricks.
MLflow 1.0
3 июня 2019 г.
MLflow — это платформа с открытым кодом для управления полным жизненным циклом машинного обучения. С помощью MLflow специалисты по обработке и анализу данных могут выполнять эксперименты локально или в облаке, упаковывать и совместно использовать модели на разных платформах, а также развертывать модели практически в любом месте.
Мы рады сообщить о сегодняшнем выпуске MLflow 1.0. В выпуске 1.0 не только повышен уровень зрелости и стабильности API, но также добавлен ряд часто запрашиваемых функций и усовершенствований:
- Интерфейс командной строки реорганизован и теперь содержит специализированные команды для артефактов, моделей, баз данных и сервера отслеживания.
- Поиск по серверу отслеживания поддерживает упрощенную версию предложения
SQL WHERE
. Помимо поддержки метрик и параметров выполнения, поиск также усовершенствован для поддержки ряда атрибутов выполнения и пользовательских и системных тегов. - Добавляет поддержку координат x в API отслеживания. Компоненты визуализации пользовательского интерфейса MLflow теперь также поддерживают отображение метрик построения для предоставленных значений координат x.
- Добавляет конечную точку REST API
runs/log-batch
, а также методы Python, R и Java для регистрации в журнале нескольких метрик, параметров и тегов с помощью одного запроса API. - В Windows для отслеживания теперь поддерживается клиент MLflow 1.0.
- Добавляет поддержку HDFS в качестве серверной части хранилища артефактов.
- Добавляет команду для создания контейнера Docker, в котором точка входа по умолчанию обслуживает указанную модель функции Python MLflow по порту 8080 в контейнере.
- Добавляет экспериментальную конфигурацию модели ONNX.
Полный список изменений можно просмотреть в журнале изменений MLflow.
Databricks Runtime 5.4 для Машинного обучения
3 июня 2019 г.
Databricks Runtime 5.4 ML построен на основе Databricks Runtime 5.4 (EoS). Эта версия содержит множество популярных библиотек машинного обучения, включая TensorFlow, PyTorch, keras и XGBoost, а также распределенное обучение TensorFlow с помощью Horovod.
Она включает приведенные ниже новые функции.
- Интеграция MLlib с MLflow (общедоступная предварительная версия).
- Hyperopt с предварительно установленным новым классом SparkTrials (общедоступная предварительная версия).
- Выходные данные HorovodRunner, отправленные из Horovod на узел драйвера Spark, теперь отображаются в ячейках записной книжки.
- Предварительно установлен пакет Python для XGBoost.
Дополнительные сведения см. в разделе Databricks Runtime 5.4 для машинного обучения (EoS).
Databricks Runtime 5.4
3 июня 2019 г.
Теперь доступна версия Databricks Runtime 5.4. Databricks Runtime 5.4 включает Apache Spark 2.4.2, обновленные библиотеки Python, R, Java и Scala, а также следующие новые функции:
- Delta Lake в Databricks теперь включает автоматическую оптимизацию (общедоступная предварительная версия)
- Использование выбранной среды IDE и сервера ноутбуков с Databricks Connect
- Программы библиотек общедоступны
- Источник данных двоичных файлов
Дополнительные сведения см. в разделе Databricks Runtime 5.4 (EoS).