Listopad 2018
Tyto funkce a vylepšení platformy Azure Databricks byly vydány v listopadu 2018.
Poznámka:
Verze jsou připraveny. Váš účet Azure Databricks se nemusí aktualizovat až do týdne po počátečním datu vydání.
Uživatelské rozhraní knihovny
Důležité
Tato aktualizace byla vrácena 7. prosince 2018.
4. listopadu 2018: Verze 2.85
V této verzi se výrazně zlepšilo uživatelské rozhraní knihovny.
Uživatelské rozhraní Azure Databricks teď podporuje knihovny pracovních prostorů a knihovny připojené ke clusteru. V pracovním prostoru existuje knihovna pracovních prostorů a lze ji připojit k jednomu nebo více clusterům. Knihovna připojená ke clusteru je knihovna, která existuje pouze v kontextu clusteru, ke kterému je připojen. Kromě toho:
- Teď můžete vytvořit knihovnu ze souboru nahraného do úložiště objektů.
- Knihovny teď můžete připojit a odpojit ze stránky s podrobnostmi knihovny a na kartě Knihovny clusteru.
- Knihovny nainstalované pomocí rozhraní API se teď zobrazují na kartě Knihovny clusteru.
Aktivace vlastních nastavení paměti haldy Spark
4. listopadu 2018: Verze 2.85
Teď se projeví následující nastavení paměti Sparku:
spark.executor.memory
spark.driver.memory
Důležité
- Azure Databricks má spuštěné služby na každém uzlu, takže maximální povolená paměť pro Spark je menší než kapacita paměti virtuálního počítače hlášeného poskytovatelem cloudu. Pokud chcete sparku poskytnout maximální velikost paměti haldy pro exekutor nebo ovladač, nezadávejte
spark.executor.memory
anispark.driver.memory
v uvedeném pořadí. - Některé konfigurace clusteru, které byly dříve neplatné, ale ignorovány, můžou způsobit selhání clusteru.
Vyřazování úloh v nečinném kontextu spuštění
4. listopadu 2018: Verze 2.85
Úlohy teď automaticky vyřaďují nečinné kontexty spuštění. Aby se minimalizovalo automatické vyřazení, Azure Databricks doporučuje používat různé clustery pro úlohy a interaktivní úlohy.
Vydání Databricks Runtime 5.0 pro strojové učení (Beta)
19. listopadu 2018
Databricks Runtime 5.0 ML (Beta) poskytuje připravené prostředí pro strojové učení a datové vědy. Obsahuje několik oblíbených knihoven, včetně TensorFlow, Keras a XGBoost. Podporuje také distribuované trénování TensorFlow pomocí Horovodu. Databricks Runtime 5.0 ML je postaven na Databricks Runtime 5.0. Databricks Runtime 5.0 ML obsahuje následující nové funkce:
- HorovodRunner, pro spouštění distribuovaných trénovacích úloh hlubokého učení pomocí Horovodu. Viz distribuované trénování.
- Podpora Conda pro správu balíčků
- Integrace MLeap
- Integrace GraphFrames
Prohlédni si kompletní poznámky k verzi databricks Runtime 5.0 ML (EoS).
Vydání Databricks Runtime 5.0
8. listopadu 2018
Databricks Runtime 5.0 je teď k dispozici. Databricks Runtime 5.0 zahrnuje Apache Spark 2.4.0, nové funkce a upgrady Delta Lake a strukturované streamování a upgrady a upgradované knihovny Python, R a Java a Scala. Podrobnosti najdete v tématu Databricks Runtime 5.0 (EoS).
V Databricks Runtime 5.0 teď Azure Databricks vyřadí nečinné kontexty spuštění, jakmile cluster dosáhne maximálního limitu kontextu (145).
displayHTML
podpora neomezeného načítání obsahu třetích stran
6. listopadu 2018: Verze 2.84
Dříve sandbox prvku displayHTML
iframe chyběl atribut allow-same-origin . To znamenalo, že prvek iframe měl nulový původ, který nebyl přátelský pro žádosti XHR mezi zdroji, soubory cookie nebo přístup k vloženým elementům iframe. V této verzi displayHTML
se iframe obsluhuje z nové domény databricksusercontent.com
a sandbox prvku iframe teď obsahuje allow-same-origin
atribut.
Pokud už pro vás funguje, nemusíte měnit používání displayHTML.
databricksusercontent.com
bude nutné, aby byl přístupný z vašeho prohlížeče. Pokud je v tuto chvíli zablokovaná podnikovou sítí, bude nutné, aby ji IT povolilo.