Sdílet prostřednictvím


Diagnostika problémů s náklady a výkonem pomocí uživatelského rozhraní Sparku

Tato příručka vás provede používáním uživatelského rozhraní Sparku k diagnostice problémů s náklady a výkonem. Je to podrobný průvodce a je to praktický návod. Místo pouhého poskytnutí vysvětlení toho, co každá stránka v uživatelském rozhraní Sparku dělá, vám řekne, co má hledat a co to znamená. Pokud neznáte koncepty ovladačů, pracovních procesů, exekutorů, fází a úloh, možná budete chtít zkontrolovat architekturu Sparku.

Pokud hledáte komplexní seznam různých optimalizačních nástrojů, použijte Průvodce optimalizací Databricks. Na oddíly průvodce optimalizací se odkazuje v tomto průvodci uživatelským rozhraním Sparku.

Použití této příručky

Pokud chcete procházet průvodce, použijte odkazy vložené na každou stránku a přejděte k dalšímu kroku. Průvodce obsahuje následující kroky v pořadí:

  1. Použití časové osy úloh k identifikaci hlavních problémů
  2. Podívejte se na nejdelší fázi
  3. Zkontrolujte vychýlení nebo přelití
  4. Určit, jestli je nejdelší fáze vázaná na vstupně-výstupní
  5. Vyhledejte další příčiny pomalého běhu fáze.

Pojďme začít!

Jak otevřít uživatelské rozhraní Sparku

  1. Přejděte na stránku clusteru:

    přejít na Výpočty

  2. Klikněte na uživatelské rozhraní Spark:

    přejít na SparkUI

Další krok

Teď, když jste otevřeli uživatelské rozhraní Sparku, si projděte časovou osu události a zjistěte další informace o kanálu nebo dotazu. Viz časová osa úloh.