2019 czerwca
Te funkcje i ulepszenia platformy Azure Databricks zostały wydane w czerwcu 2019 r.
Uwaga
Wydania są etapowe. Twoje konto usługi Azure Databricks może nie zostać zaktualizowane do tygodnia po początkowej dacie wydania.
Obsługa wystąpień Lsv2 jest ogólnie dostępna
24 czerwca 2019 r. — 26 czerwca 2019 r.: Wersja 2.100
Usługa Azure Databricks zapewnia teraz pełną obsługę serii maszyn wirtualnych Lsv2 w przypadku obciążeń o wysokiej przepływności i dużej liczby operacji we/wy na sekundę.
Integracja RStudio nie jest już ograniczona do klastrów o dużej współbieżności
6 czerwca – 11, 2019: Wersja 2.99
Teraz możesz włączyć program RStudio Server w klastrach standardowych w usłudze Azure Databricks oprócz klastrów o wysokiej współbieżności, które były już obsługiwane. Niezależnie od trybu klastra integracja programu RStudio Server nadal wymaga wyłączenia opcji automatycznego kończenia dla klastra. Zobacz RStudio w usłudze Azure Databricks.
MLflow 1.0
3 czerwca 2019 r.
MLflow to platforma typu open source do zarządzania pełnym cyklem życia uczenia maszynowego. Dzięki platformie MLflow analitycy danych mogą śledzić i udostępniać eksperymenty lokalnie lub w chmurze, pakować i udostępniać modele w różnych strukturach oraz wdrażać modele praktycznie w dowolnym miejscu.
Z przyjemnością ogłaszamy dzisiaj wydanie MLflow 1.0. Wersja 1.0 oznacza nie tylko dojrzałość i stabilność interfejsów API, ale także dodaje szereg często żądanych funkcji i ulepszeń:
- Interfejs wiersza polecenia został zreorganizowany i ma teraz dedykowane polecenia dla artefaktów, modeli, bazy danych (bazy danych śledzenia) i serwera (serwera śledzenia).
- Wyszukiwanie serwera śledzenia obsługuje uproszczoną wersję klauzuli
SQL WHERE
. Oprócz obsługi metryk uruchamiania i parametrów wyszukiwanie zostało ulepszone w celu obsługi niektórych atrybutów przebiegu oraz tagów użytkownika i systemu. - Dodaje obsługę współrzędnych x w interfejsie API śledzenia. Składniki wizualizacji interfejsu użytkownika platformy MLflow obsługują teraz również kreślenie metryk względem podanych wartości współrzędnych x.
- Dodaje punkt końcowy
runs/log-batch
interfejsu API REST oraz metody w Pythonie, R i Java do rejestrowania wielu metryk, parametrów i tagów za pomocą jednego żądania API. - Na potrzeby śledzenia klient MLflow 1.0 jest teraz obsługiwany w systemie Windows.
- Dodaje obsługę systemu plików HDFS jako zaplecza magazynu artefaktów.
- Dodaje polecenie do kompilowania kontenera platformy Docker, którego domyślny punkt wejścia obsługuje określony model funkcji języka Python MLflow na porcie 8080 w kontenerze.
- Dodaje eksperymentalną odmianę modelu ONNX .
Pełną listę zmian można wyświetlić w dzienniku zmian MLflow.
Databricks Runtime 5.4 na potrzeby uczenia maszynowego
3 czerwca 2019 r.
Środowisko Databricks Runtime 5.4 ML jest oparte na środowisku Databricks Runtime 5.4 (EoS). Zawiera wiele popularnych bibliotek uczenia maszynowego, w tym TensorFlow, PyTorch, Keras i XGBoost oraz zapewnia rozproszone trenowanie Biblioteki TensorFlow przy użyciu struktury Horovod.
Obejmuje ona następujące nowe funkcje:
- Integracja biblioteki MLlib z rozwiązaniem MLflow (publiczna wersja zapoznawcza).
- Funkcja Hyperopt z nową wstępnie zainstalowaną klasą SparkTrials (publiczna wersja zapoznawcza).
- Dane wyjściowe narzędzia HorovodRunner wysyłane z platformy Horovod do węzła sterownika Spark są teraz widoczne w komórkach notesu.
- Wstępnie zainstalowany pakiet języka Python XGBoost.
Aby uzyskać szczegółowe informacje, zobacz Databricks Runtime 5.4 for ML (EoS).
Databricks Runtime 5.4
3 czerwca 2019 r.
Środowisko Databricks Runtime 5.4 jest teraz dostępne. Środowisko Databricks Runtime 5.4 obejmuje platformę Apache Spark 2.4.2, uaktualnione biblioteki Python, R, Java i Scala oraz następujące nowe funkcje:
- Delta Lake na platformie Databricks dodaje Auto Optymalizację (wersja publiczna zapoznawcza)
- Używanie ulubionego środowiska IDE i serwera notesu z usługą Databricks Connect
- Narzędzia biblioteki są ogólnie dostępne
- Źródło danych pliku binarnego
Aby uzyskać szczegółowe informacje, zobacz Databricks Runtime 5.4 (EoS).