Diagnostika problémů s náklady a výkonem pomocí uživatelského rozhraní Sparku
Tato příručka vás provede používáním uživatelského rozhraní Sparku k diagnostice problémů s náklady a výkonem. Je to podrobný průvodce a je to praktický návod. Místo pouhého poskytnutí vysvětlení toho, co každá stránka v uživatelském rozhraní Sparku dělá, vám řekne, co má hledat a co to znamená. Pokud neznáte koncepty ovladačů, pracovních procesů, exekutorů, fází a úloh, možná budete chtít zkontrolovat architekturu Sparku.
Pokud hledáte komplexní seznam různých optimalizačních nástrojů, použijte Průvodce optimalizací Databricks. Na oddíly průvodce optimalizací se odkazuje v tomto průvodci uživatelským rozhraním Sparku.
Použití této příručky
Pokud chcete procházet průvodce, použijte odkazy vložené na každou stránku a přejděte k dalšímu kroku. Průvodce obsahuje následující kroky v pořadí:
- Použití časové osy úloh k identifikaci hlavních problémů
- Podívejte se na nejdelší fázi
- Zkontrolujte vychýlení nebo přelití
- Určit, jestli je nejdelší fáze vázaná na vstupně-výstupní
- Vyhledejte další příčiny pomalého běhu fáze.
Pojďme začít!
Jak otevřít uživatelské rozhraní Sparku
Přejděte na stránku clusteru:
Klikněte na uživatelské rozhraní Spark:
SparkUI
Další krok
Teď, když jste otevřeli uživatelské rozhraní Sparku, si projděte časovou osu události a zjistěte další informace o kanálu nebo dotazu. Viz časová osa úloh.