Nastavení a použití proměnných prostředí s inicializačními skripty
Inicializační skripty mají přístup ke všem proměnným prostředí, které jsou přítomné v clusteru. Azure Databricks nastaví mnoho výchozích proměnných, které můžou být užitečné v logice inicializačních skriptů.
Proměnné prostředí nastavené v konfiguraci Sparku jsou k dispozici pro inicializační skripty. Viz proměnné prostředí.
Jaké proměnné prostředí jsou ve výchozím nastavení zpřístupněny inicializačnímu skriptu?
Clusterové a globální inicializační skripty podporují následující proměnné prostředí:
DB_CLUSTER_ID
: ID clusteru, na kterém je skript spuštěný. Podívejte se na rozhraní API clusterů.DB_CONTAINER_IP
: privátní IP adresa kontejneru, ve kterém běží Spark. Inicializační skript se spustí uvnitř tohoto kontejneru. Podívejte se na rozhraní API clusterů.DB_IS_DRIVER
: Zda skript běží na uzlu ovladače.DB_DRIVER_IP
: IP adresa uzlu ovladače.DB_INSTANCE_TYPE
: typ instance hostitelského virtuálního počítače.DB_CLUSTER_NAME
: název clusteru, na který se skript spouští.DB_IS_JOB_CLUSTER
: Zda byl cluster vytvořen pro spuštění úlohy. Viz Konfigurace výpočetních prostředků pro úlohy.
Pokud například chcete spustit část skriptu pouze na uzlu ovladače, můžete napsat skript jako:
echo $DB_IS_DRIVER
if [[ $DB_IS_DRIVER = "TRUE" ]]; then
<run this part only on driver>
else
<run this part only on workers>
fi
<run this part on both driver and workers>
Použití tajných kódů v inicializačních skriptech
Pokud odkazujete na tajný klíč, můžete použít libovolný platný název proměnné. Přístup k tajným kódům odkazovaným v proměnných prostředí je určen oprávněními uživatele, který cluster nakonfiguroval. Tajné kódy uložené v proměnných prostředí jsou přístupné všem uživatelům clusteru, ale jsou redactovány ze zobrazení prostého textu.
Viz Použití tajného kódu ve vlastnosti konfigurace Sparku nebo proměnné prostředí.