Květen 2018
Verze jsou připraveny. Váš účet Azure Databricks se nemusí aktualizovat až do týdne po počátečním datu vydání.
Obecné nařízení o ochraně osobních údajů (GDPR)
24. května 2018: Verze 2.72
Abychom splnili požadavky obecného nařízení Evropské unie o ochraně osobních údajů (GDPR), které platí 25. května 2018, provedli jsme řadu úprav platformy Azure Databricks, abychom vám poskytli větší kontrolu nad uchováváním dat na úrovni účtu i uživatele. Mezi aktualizace patří:
- Odstranění clusteru: Trvale odstraňte konfiguraci clusteru pomocí uživatelského rozhraní nebo rozhraní API clusterů. Viz Odstranění výpočetních prostředků.
- Vyprázdnění pracovního prostoru (vydané ve verzi 2.71): Trvale odstraňte objekty pracovního prostoru, jako jsou celé poznámkové bloky, jednotlivé buňky poznámkového bloku, komentáře jednotlivých poznámkových bloků a historie revizí poznámkového bloku. Viz Vyprázdnit úložiště pracovního prostoru.
- Vymazání historie revizí poznámkového bloku:
- Trvale odstraňte historii revizí všech poznámkových bloků v pracovním prostoru pro definovaný časový rámec. Viz Vyprázdnit úložiště pracovního prostoru.
- Trvale odstraňte jednu revizi poznámkového bloku nebo celou historii revizí poznámkového bloku. Zobrazit historii verzí v poznámkových blocích.
Informace o odstranění služby Azure Databricks nebo zrušení účtu Azure najdete v tématu Správa předplatného.
Uživatelé Azure Databricks musí patřit do tenanta Microsoft Entra ID.
24. května 2018: Verze 2.72
Uživatelé se teď můžou k Azure Databricks přihlásit jenom v případě, že patří do tenanta Microsoft Entra ID (dříve Azure Active Directory) pracovního prostoru Azure Databricks. Pokud máte uživatele, kteří nepatří do tenanta Microsoft Entra ID, můžete je přidat jako standardní uživatele nebo uživatele typu host.
HorovodEstimator
29. května 2018: Verze 2.72
Přidání dokumentace a poznámkového bloku pro HorovodEstimator, rozhraní API pro odhad stylu MLlib, které využívá architekturu Horovod od Uberu . HorovodEstimator usnadňuje distribuované trénování hlubokého neurálních sítí s více GPU v datových rámcích Sparku, což zjednodušuje integraci ETL ve Sparku s trénováním modelů v TensorFlow.
Export modelu ML MLeap
24. května 2018: Verze 2.72
Přidání dokumentace a poznámkových bloků k používání MLeap v Azure Databricks MLeap umožňuje nasadit kanály strojového učení z Apache Sparku a scikit-learn do přenosného formátu a prováděcího modulu. Viz export modelu MLeap ML.
Ještě více typů clusterů GPU
24. května 2018: Verze 2.72
Kromě typů instancí NC Azure (NC12 a NC24), které jsme přidali ve verzi 2.71, teď podporujeme řadu typů instancí NCv3 (NC6s_v3, NC12s_v3 a NC24s_v3) v clusterech Azure Databricks. Instance NC a NCv3 poskytují GPU pro výkon zpracování obrázků, analýzy textu a dalších úloh strojového učení a hlubokého učení, které jsou výpočetně náročné a vyžadují vynikající výkon.
Podívejte se na výpočetní prostředky s podporou GPU.
Buňky v poznámkovém bloku: skrytí a zobrazení
24. května 2018: Verze 2.72
Nové indikátory a zasílání zpráv usnadňují zobrazení obsahu buněk poznámkového bloku po jejich skrytí. Viz Skrýt a zobrazit obsah buňky.
Hledání na webu s dokumentací
22. května 2018
Vyhledávání na webu dokumentace jsme nahradili lepším vyhledávacím nástrojem. V nadcházejících týdnech uvidíte ještě více vylepšení hledání.
Poznámka:
Pokud ho zkusíte krátce po nasazení nového hledání, může vyhledávání vypadat poškozeno. Jednoduše vymažte mezipaměť prohlížeče a podívejte se na nové prostředí hledání.
Databricks Runtime 4.1 ML pro strojové učení (Beta)
17. května 2018
Databricks Runtime ML (Beta) poskytuje připravené prostředí pro strojové učení a datové vědy. Obsahuje několik oblíbených knihoven, včetně TensorFlow, Keras a XGBoost.
Databricks Runtime ML umožňuje spustit cluster Databricks se všemi knihovnami potřebnými pro distribuované trénování TensorFlow. Zajišťuje kompatibilitu knihoven zahrnutých v clusteru (mezi TensorFlow a CUDA / cuDNN, například) a podstatně snižuje čas spuštění clusteru v porovnání s použitím inicializačních skriptů.
Poznámka:
Databricks Runtime 4.1 ML je k dispozici pouze v SKU Premium.
Prohlédni si kompletní poznámky k verzi databricks Runtime 4.1 ML (EoS).
Databricks Delta
17. května 2018
Databricks Delta je teď k dispozici ve verzi Private Preview pro uživatele Azure Databricks. Obraťte se na svého správce účtů nebo se zaregistrujte na adrese https://databricks.com/product/databricks-delta. Tato verze představuje kandidátské vydání v očekávání nadcházející verze GA.
Další informace najdete v tématu Databricks Runtime 4.1 (EoS) a Co je Delta Lake?.
Podpora Display() pro obrazové datové typy
17. května 2018
V Databricks Runtime 4.1 display()
teď vykresluje columns obsahující datové typy obrázků jako formátovaný kód HTML.
Viz Vizualizace v poznámkových blocích Databricks.
Typy clusterů GPU
15. května 2018: Verze 2.71
S radostí oznamujeme podporu pro typy instancí nc Azure (NC12 a NC24) v clusterech Azure Databricks. Instance NC poskytují gpu pro zpracování obrázků, analýzu textu a další úlohy strojového učení a hlubokého učení, které jsou výpočetně náročné a vyžadují vynikající výkon.
Azure Databricks také poskytuje předem nainstalované ovladače a knihovny NVIDIA nakonfigurované pro GPU spolu s materiály pro začátek s několika oblíbenými knihovnami hlubokého učení.
Viz také:
Obecná dostupnost správy tajných kódů
15. května 2018: Verze 2.71
Správa tajných kódů, která byla ve verzi Private Preview, je teď obecně dostupná. Poskytuje výkonné nástroje pro správu credentials, které potřebujete k ověření přístupu k externím zdrojům dat. Místo zadávání credentials přímo do poznámkového bloku použijte správu tajných kódů Databricks k ukládání a odkazování na credentials v poznámkových blocích a úlohách. Ke správě tajných kódů můžete použít rozhraní příkazového řádku tajných kódů (starší verze) pro přístup k rozhraní API tajných kódů.
Poznámka:
Správa tajných kódů vyžaduje Databricks Runtime 4.0 nebo novější a Databricks CLI 0.7.1 nebo novější.
Viz Správa tajných kódů.
Změny koncových bodů rozhraní API a příkazů CLI pro tajné kódy
15. května 2018: Verze 2.71
V koncových bodech rozhraní API pro tajné kódy byly provedeny následující změny:
- Pro všechny koncové body se kořenová cesta změnila z
/secret
na/secrets
. - U koncového bodu tajných kódů byl sbalený
/secret/secrets
do/secrets/
. - Metoda
write
byla změněna naput
.
Databricks CLI 0.7.1 obsahuje aktualizace příkazů tajných kódů, které odpovídají těmto aktualizovaným koncovým bodům rozhraní API.
Viz rozhraní API pro tajné kódy a správa tajných kódů.
Připnutí clusteru
15. května 2018: Verze 2.71
Teď můžete cluster připnout ke clusterům list. To vám umožní zachovat konfiguraci clusterů ukončených více než 30 dnů.
Kromě toho se na stránce Clustery teď zobrazují všechny clustery, které byly ukončeny do 30 dnů (zvýšeno z 7 dnů).
Viz Připnutí výpočetních prostředků.
Automatické spuštění clusteru
15. května 2018: Verze 2.71
Před touto verzí se úlohy naplánované tak, aby běžely v Terminated
clusterech, selhaly. U clusterů vytvořených v Azure Databricks verze 2.71 a novějších příkazy z rozhraní JDBC/ODBC nebo spuštění úlohy přiřazené existujícímu ukončeném clusteru se automaticky restartuje. Viz Připojení k JDBC a konfigurace a úprava úloh Databricks.
Automatický start umožňuje nakonfigurovat clustery tak, aby se automaticky zprovozněly, aniž by bylo nutné ručně provést zásah k restartování clusterů pro naplánované úlohy. Kromě toho můžete naplánovat inicializaci clusteru naplánováním úlohy, která restartuje clustery v zadaném čase.
Řízení přístupu ke clusteru se vynucuje a oprávnění vlastníka úlohy se kontrolují obvyklým způsobem.
Vyprazdňování pracovního prostoru
15. května 2018: Verze 2.71
V rámci našeho průběžného úsilí o dodržování obecného nařízení Evropské unie o ochraně osobních údajů (GDPR) jsme přidali možnost vyprázdnit objekty pracovního prostoru, jako jsou celé poznámkové bloky, jednotlivé buňky poznámkového bloku, komentáře jednotlivých poznámkových bloků a historie revizí poznámkového bloku. V nadcházejících týdnech vydáme další funkce a dokumentaci pro podporu dodržování předpisů GDPR.
Viz Vyprázdnit úložiště pracovního prostoru.
Databricks CLI 0.7.1
10. května 2018
Databricks CLI 0.7.1 obsahuje aktualizace příkazů tajných kódů, které odpovídají aktualizovaným koncovým bodům rozhraní API.