Ограничения для Databricks Connect для Python
Примечание.
В этой статье рассматриваются Databricks Connect для Databricks Runtime 13.3 LTS и более поздних версий.
В этой статье перечислены ограничения для Databricks Connect для Python. Databricks Connect позволяет подключать популярные идентификаторы, серверы записных книжек и пользовательские приложения к кластерам Azure Databricks. См. раздел "Что такое Databricks Connect?". Сведения о версии Scala этой статьи см. в разделе "Ограничения" с Databricks Connect для Scala.
Недоступно в Databricks Connect для Databricks Runtime 13.3 LTS и ниже:
- Течение
foreachBatch
- Создание кадров данных размером более 128 МБ
- Длинные запросы в течение 3600 секунд
Недоступно:
- API набора данных
- Типизированные API набора данных (например
reduce()
, иflatMap()
) - Служебные программы Databricks:
credentials
, ,library
notebook workflow
widgets
SparkContext
RDDs
- Вывод модели MLflow:
pyfunc.spark_udf()
API - Геопространственный фрагмент мозаики
CREATE TABLE <table-name> AS SELECT
(вместо этого используйтеspark.sql("SELECT ...").write.saveAsTable("table")
)ApplyinPandas()
иCogroup()
с общими кластерами- Изменение уровня журнала log4j с помощью
SparkContext
- Обучение распределенного машинного обучения
- Синхронизация локальной среды разработки с удаленным кластером