Luty 2020 r.
Te funkcje i ulepszenia platformy Azure Databricks zostały wydane w lutym 2020 r.
Uwaga
Wydania są etapowe. Twoje konto usługi Azure Databricks może nie zostać zaktualizowane do tygodnia po początkowej dacie wydania.
Databricks Runtime 6.4 dla usługi Genomics (ogólna dostępność)
26 lutego 2020 r.
Środowisko Databricks Runtime 6.4 dla usługi Genomics jest oparte na środowisku Databricks Runtime 6.4. Zawiera wiele ulepszeń i uaktualnień środowiska Databricks Runtime 6.3 dla usługi Genomics.
Najważniejsze funkcje to:
- Teraz można dostosować użytkowników potoku DNASeq, aby selektywnie wyłączyć dowolną wiarygodną kombinację wyrównania odczytu, wywołania wariantu i etapów adnotacji wariantów. Użytkownicy mogą również wykonywać wyrównanie odczytu jednokrotnego.
- Wersja narzędzia Glow dostępna w środowisku Databricks Runtime 6.4 dla usługi Genomics udostępnia teraz interfejsy API języka Python i Języka Scala dla funkcji, które były wcześniej uwidocznione tylko za pośrednictwem wyrażeń SQL. Te funkcje są dostępne dla operacji ramki danych, zapewniając lepsze bezpieczeństwo kompilowania.
Databricks Runtime 6.4 ML (ogólna dostępność)
26 lutego 2020 r.
Środowisko Databricks Runtime 6.4 ML zapewnia uaktualnienia bibliotek, w tym:
- PyTorch: od 1.3.1 do 1.4.0
- Horovod: od 0.18.2 do 1.19.0
Aby uzyskać szczegółowe informacje, zobacz pełne informacje o wersji środowiska Databricks Runtime 6.4 for ML (EoS).
Databricks Runtime 6.4 (ogólna dostępność)
26 lutego 2020 r.
Środowisko Databricks Runtime 6.4 (ogólna dostępność) oferuje nowe funkcje, ulepszenia i wiele poprawek błędów.
- Przyrostowe przetwarzanie nowych plików danych za pomocą modułu automatycznego ładowania (publiczna wersja zapoznawcza). Automatyczne ładowanie zapewnia wydajniejszy sposób przetwarzania nowych plików danych przyrostowo podczas procesu ETL w magazynie obiektów blob w chmurze. Jest to poprawa przesyłania strumieniowego ze strukturą opartą na plikach, która identyfikuje nowe pliki, wielokrotnie wyświetlając katalog w chmurze i śledząc pliki, które zostały zaobserwowane, i może być bardzo nieefektywna w miarę wzrostu katalogu.
- Załaduj dane do usługi Delta Lake przy użyciu ponownych prób idempotentnych (publiczna wersja zapoznawcza). Polecenie
COPY INTO
SQL umożliwia ładowanie danych do usługi Delta Lake przy użyciu ponownych prób idempotentnych (publiczna wersja zapoznawcza). Aby załadować dane do usługi Delta Lake dzisiaj, musisz użyć interfejsów API ramki danych platformy Apache Spark. Jeśli podczas ładowania występują błędy, należy je skutecznie obsługiwać. - Metryki operacji dla wszystkich operacji zapisu, aktualizacji i usuwania w tabeli delty są teraz wyświetlane w historii tabel.
- Wbudowane dane biblioteki Matplotlib są teraz domyślnie włączone w notesach usługi Azure Databricks (publiczna wersja zapoznawcza).
Aby uzyskać szczegółowe informacje, zobacz pełne informacje o wersji środowiska Databricks Runtime 6.4 (EoS ).
Nowe wykresy interakcyjne oferują obsługę rozbudowanych interakcji po stronie klienta
25 lutego — 3 marca 2019 r.: Wersja 3.14
W tej wersji wprowadzono dwa nowe interaktywne typy wykresów, które zastępują implementacje wykresu słupkowego i liniowego. Oprócz istniejących funkcji wykresu wykres liniowy ma kilka nowych opcji wykresu niestandardowego: ustawianie zakresu osi Y, pokazywanie lub ukrywanie znaczników oraz stosowanie skali dziennika do osi Y. Oba wykresy mają wbudowany pasek narzędzi, który obsługuje bogaty zestaw interakcji po stronie klienta.
Jeśli chcesz użyć istniejących implementacji wykresów, możesz wybrać je z menu rozwijanego Starsze wykresy . Istniejące wykresy będą nadal korzystać z poprzednio dostępnych implementacji.
Nowa sieć pozyskiwania danych dodaje integracje partnerskie z usługą Delta Lake (publiczna wersja zapoznawcza)
24 lutego 2020 r.
Teraz możesz łatwo wypełnić usługę "lakehouse" — usługę Data Lake z uprawnieniami do tego rodzaju struktur danych i funkcji zarządzania danymi, które zwykle są dostępne w magazynie danych — od setek źródeł danych do usługi Delta Lake. W centrum tej sieci jest nowa galeria integracji partnerów, dostępna z obszaru roboczego i zapewniająca dostęp do ogromnej sieci źródeł danych za pośrednictwem naszych partnerów Fivetran, Qlik, Infoworks, StreamSets i Syncsort.
Aby zapoznać się z omówieniem, zobacz nasz blog. Aby uzyskać szczegółowe informacje, zobacz Partnerów technologicznych.
Twórca obszaru roboczego jest automatycznie dodawany jako administrator usługi Azure Databricks
24 lutego 2020 r.
Przed 24 lutego 2020 r. użytkownik, który utworzył obszar roboczy usługi Azure Databricks, zostanie dodany tylko jako administrator obszaru roboczego, jeśli kliknie również przycisk Uruchom obszar roboczy w witrynie Azure Portal lub został dodany jako administrator przez użytkownika, który był już administratorem w obszarze roboczym (każdy współautor platformy Azure dla subskrypcji, który kliknął przycisk Uruchom obszar roboczy , zostanie utworzony jako administrator w obszarze roboczym). Teraz użytkownik tworzący obszar roboczy zostanie automatycznie dodany jako administrator obszaru roboczego.
Aby uzyskać szczegółowe informacje na temat tworzenia i uruchamiania obszarów roboczych, zobacz Zarządzanie subskrypcją
Są już dostępne flagi do zarządzania zabezpieczeniami obszaru roboczego i funkcjami notesu
4-11 lutego 2020 r.: Wersja 3.12
W tej wersji wprowadzono nowe flagi do zarządzania nagłówkami zabezpieczeń, które są wysyłane w celu zapobiegania atakom w obszarze roboczym, a także dostępu do pobierania wyników notesu i przechowywania wersji usługi Git. Wszystkie te opcje administracyjne są domyślnie włączone.