Omezení služby Databricks Connect pro Python
Poznámka:
Tento článek popisuje Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší.
Tento článek obsahuje omezení služby Databricks Connect pro Python. Databricks Connect umožňuje připojit k clusterům Azure Databricks oblíbené prostředí IDEs, servery poznámkových bloků a vlastní aplikace. Podívejte se, co je Databricks Connect? Informace o verzi Scala tohoto článku najdete v tématu Omezení služby Databricks Connect pro Scala.
Důležitý
V závislosti na verzi Pythonu, Databricks Runtime a Databricks Connect, kterou používáte, můžou některé funkce mít požadavky na verzi. Viz požadavky .
Dostupnost funkcí
Není k dispozici v Databricks Connect pro Databricks Runtime 13.3 LTS a níže:
- Proudem
foreachBatch
- Vytváření datových rámců větších než 128 MB
- Dlouhé dotazy delší než 3600 sekund
Není k dispozici:
-
dataframe.display()
API - Nástroje Databricks:
credentials
,library
,notebook workflow
,widgets
- Kontext Sparku
- RDDs
- Knihovny, které používají sady RDD, Spark Context nebo přistupují k podkladovému prostředí Spark JVM, jako jsou Mosaic geospatial, GraphFrames nebo GreatExpectations.
-
CREATE TABLE <table-name> AS SELECT
(místo toho použijtespark.sql("SELECT ...").write.saveAsTable("table")
) -
ApplyinPandas()
aCogroup()
se sdílenými clustery - Změna úrovně protokolu log4j prostřednictvím
SparkContext
- Distribuované trénování ML
- Synchronizace místního vývojového prostředí se vzdáleným clusterem
- Na serverless výpočetních prostředcích nemohou UDFs zahrnovat vlastní knihovny.