Udostępnij za pośrednictwem


2019 kwietnia

Te funkcje i ulepszenia platformy Azure Databricks zostały wydane w kwietniu 2019 r.

Uwaga

Wydania są etapowe. Twoje konto usługi Azure Databricks może nie zostać zaktualizowane do tygodnia po początkowej dacie wydania.

Platforma MLflow w usłudze Azure Databricks (ogólna dostępność)

25 kwietnia 2019 r.

Zarządzana biblioteka MLflow w usłudze Azure Databricks jest teraz ogólnie dostępna. Rozwiązanie MLflow w usłudze Azure Databricks oferuje hostowaną wersję rozwiązania MLflow w pełni zintegrowaną z modelem zabezpieczeń usługi Databricks i interaktywnym obszarem roboczym. Zobacz MLflow dla agenta generatywnej sztucznej inteligencji i cyklu życia modelu uczenia maszynowego.

Usługa Delta Lake w ramach usługi Azure Databricks

24 kwietnia 2019 r.

Usługa Databricks utworzyła projekt usługi Delta Lake typu open source. Usługa Delta Lake to warstwa magazynu, która zapewnia niezawodność magazynom danych opartym na systemie plików HDFS i magazynie w chmurze, zapewniając transakcje ACID dzięki optymistycznej kontroli współbieżności między zapisami i izolacją migawek w celu uzyskania spójnych operacji odczytu podczas zapisu. Usługa Delta Lake udostępnia również wbudowane przechowywanie wersji danych w celu łatwego wycofywania i odtwarzania raportów.

Uwaga

To, co wcześniej nosiło nazwę delta usługi Databricks, to teraz projekt typu open source usługi Delta Lake oraz optymalizacje dostępne w usłudze Azure Databricks. Zobacz Co to jest usługa Delta Lake?.

Pasek boczny przebiegów MLflow

9 kwietnia – 16, 2019: Wersja 2.95

Teraz możesz wyświetlić uruchomienia biblioteki MLflow i poprawki notesu utworzone na pasku bocznym obok notesu. Na prawym pasku bocznym notesu kliknij ikonę Experiment iconEksperyment.

Zobacz Tworzenie eksperymentu notesu.

Automatyczny dostęp do Azure Data Lake Storage Gen1 i Gen2 za pomocą poświadczeń Microsoft Entra ID (GA)

9 kwietnia – 16, 2019: Wersja 2.95

Z przyjemnością ogłaszamy ogólną dostępność automatycznego uwierzytelniania w usłudze Azure Data Lake Storage Gen1 i Gen2 z klastrów usługi Azure Databricks przy użyciu tej samej tożsamości identyfikatora Entra firmy Microsoft, której używasz do logowania się do usługi Azure Databricks.

Wystarczy włączyć klaster dla funkcji przekazywania poświadczeń Microsoft Entra ID, a polecenia uruchamiane na tym klastrze będą mogły odczytywać i zapisywać dane w usłudze Azure Data Lake Storage Gen1 i Gen2 bez konieczności konfigurowania poświadczeń jednostki usługi do uzyskiwania dostępu do magazynu.

Aby uzyskać więcej informacji, zobacz Access Azure Data Lake Storage using Microsoft Entra ID credential passthrough (starsza wersja).

Databricks Runtime 5.3 (ogólna dostępność)

3 kwietnia 2019 r.

Środowisko Databricks Runtime 5.3 jest teraz ogólnie dostępne. Środowisko Databricks Runtime 5.3 zawiera nowe funkcje i uaktualnienia usługi Delta Lake oraz uaktualnione biblioteki Python, R, Java i Scala.

Główne uaktualnienia obejmują:

  • Databricks Delta time travel (ogólna dostępność)
  • Replikacja tabel MySQL do usługi Delta, publiczna wersja zapoznawcza
  • Zoptymalizowany folder DBFS FUSE pod kątem obciążeń uczenia głębokiego
  • Ulepszenia biblioteki o zakresie notesu
  • Nowe wskazówki doradcy usługi Databricks

Aby uzyskać szczegółowe informacje, zobacz Databricks Runtime 5.3 (EoS).

Databricks Runtime 5.3 ML (ogólna dostępność)

3 kwietnia 2019 r.

Dzięki środowisku Databricks Runtime 5.3 na potrzeby uczenia maszynowego uzyskaliśmy pierwszą częścią ogólnodostępną usługi Databricks Runtime ML! Środowisko Databricks Runtime ML zapewnia gotowe do użycia środowisko do uczenia maszynowego i nauki o danych. Jest ona oparta na środowisku Databricks Runtime i dodaje wiele popularnych bibliotek uczenia maszynowego, w tym TensorFlow, PyTorch, Keras i XGBoost. Obsługuje ono także trenowanie rozproszone przy użyciu struktury Horovod.

Ta wersja jest oparta na środowisku Databricks Runtime 5.3 z dodatkowymi bibliotekami, różnymi wersjami bibliotek i zarządzanie pakietami Conda dla bibliotek języka Python. Główne nowe funkcje, ponieważ środowisko Databricks Runtime 5.2 ML Beta obejmują:

  • Integracja biblioteki MLlib z platformą MLflow (prywatna wersja zapoznawcza), która zapewnia automatyczne rejestrowanie przebiegów MLflow dla modeli dopasowanych przy użyciu algorytmów CrossValidator dostrajania PySpark i TrainValidationSplit.

    Jeśli chcesz wziąć udział w wersji zapoznawczej, skontaktuj się z zespołem ds. kont usługi Databricks.

  • Uaktualnia biblioteki PyArrow, Horovod i TensorboardX.

    Aktualizacja PyArrow dodaje możliwość używania BinaryType podczas przeprowadzania konwersji opartej na Arrow i udostępnia ją w pandas UDF.

Aby uzyskać więcej informacji, zobacz Databricks Runtime 5.3 ML (EoS). Aby uzyskać instrukcje dotyczące tworzenia klastra uczenia maszynowego środowiska Databricks Runtime, zobacz Sztuczna inteligencja i uczenie maszynowe w usłudze Databricks.