Delen via


Foutopsporing in Spark-taken met Azure Toolkit voor IntelliJ (preview)

Dit artikel bevat stapsgewijze richtlijnen voor het gebruik van HDInsight Tools in Azure Toolkit for IntelliJ om Spark Failure Debug Applications uit te voeren.

Vereisten

Een project maken met een foutopsporingssjabloon

Maak een spark2.3.2-project om door te gaan met foutopsporing. Neem foutopsporingsvoorbeeldbestand voor fouttaken in dit document.

  1. Open IntelliJ IDEA. Open het venster Nieuw project .

    a. Selecteer Azure Spark/HDInsight in het linkerdeelvenster.

    b. Selecteer Spark-project met foutopsporingsvoorbeeld (preview)(Scala) in het hoofdvenster.

    IntelliJ Een foutopsporingsproject maken.

    c. Selecteer Volgende.

  2. Voer in het venster Nieuw project de volgende stappen uit:

    IntelliJ New Project selecteer Spark-versie.

    a. Voer een projectnaam en projectlocatie in.

    b. Selecteer In de vervolgkeuzelijst Project SDK Java 1.8 voor Spark 2.3.2-cluster.

    c. Selecteer Spark 2.3.2(Scala 2.11.8) in de vervolgkeuzelijst Spark-versie.

    d. Selecteer Voltooien.

  3. Selecteer src>main>scala om uw code in het project te openen. In dit voorbeeld wordt het script AgeMean_Div() gebruikt.

Een Spark Scala/Java-toepassing uitvoeren op een HDInsight-cluster

Maak een Spark Scala/Java-toepassing en voer de toepassing vervolgens uit op een Spark-cluster door de volgende stappen uit te voeren:

  1. Klik op Configuratie toevoegen om het venster Uitvoeren/foutopsporingsconfiguraties te openen.

    HDI IntelliJ Add-configuratie.

  2. Selecteer in het dialoogvenster Configuraties uitvoeren /fouten opsporen het plusteken (+). Selecteer vervolgens de optie Apache Spark in HDInsight .

    IntelliJ Nieuwe configuratie toevoegen.

  3. Schakel over naar extern uitvoeren op het tabblad Cluster . Voer informatie in voor de naam, het Spark-cluster en de naam van de hoofdklasse. Onze hulpprogramma's ondersteunen foutopsporing met executors. De numExecutors, de standaardwaarde is 5 en u kunt beter niet hoger dan 3 instellen. Als u de runtime wilt verminderen, kunt u spark.yarn.maxAppAttempts toevoegen aan taakconfiguraties en de waarde instellen op 1. Klik op de knop OK om de configuratie op te slaan.

    IntelliJ Voer nieuwe foutopsporingsconfiguraties uit.

  4. De configuratie wordt nu opgeslagen met de naam die u hebt opgegeven. Als u de configuratiedetails wilt weergeven, selecteert u de configuratienaam. Als u wijzigingen wilt aanbrengen, selecteert u Configuraties bewerken.

  5. Nadat u de configuratie-instellingen hebt voltooid, kunt u het project uitvoeren op het externe cluster.

    IntelliJ Debug Remote Spark Job Remote run button.

  6. U kunt de toepassings-id in het uitvoervenster controleren.

    IntelliJ Debug Remote Spark Job Remote run result.

Mislukt taakprofiel downloaden

Als het indienen van de taak mislukt, kunt u het mislukte taakprofiel downloaden naar de lokale computer voor verdere foutopsporing.

  1. Open Microsoft Azure Storage Explorer, zoek het HDInsight-account van het cluster voor de mislukte taak, download de resources van de mislukte taak vanaf de bijbehorende locatie: \hdp\spark2-events\.spark-failures\<application ID> naar een lokale map. In het activiteitenvenster wordt de voortgang van het downloaden weergegeven.

    Downloadfout in Azure Storage Explorer.

    Downloaden van Azure Storage Explorer is voltooid.

Lokale foutopsporingsomgeving configureren en fouten opsporen bij fouten

  1. Open het oorspronkelijke project of maak een nieuw project en koppel het aan de oorspronkelijke broncode. Momenteel wordt alleen spark2.3.2-versie ondersteund voor foutopsporing.

  2. Maak in IntelliJ IDEA een Spark-foutopsporingsconfiguratiebestand en selecteer het FTD-bestand uit de eerder gedownloade mislukte taakbronnen voor het locatieveld Spark-taakfoutcontext .

    kreta fout configuratie.

  3. Klik op de knop Lokaal uitvoeren op de werkbalk. De fout wordt weergegeven in het venster Uitvoeren.

    run-failure-configuration1.

    run-failure-configuration2.

  4. Stel het onderbrekingspunt in zoals het logboek aangeeft en klik vervolgens op de lokale foutopsporingsknop om lokale foutopsporing uit te voeren, net zoals uw normale Scala/Java-projecten in IntelliJ.

  5. Als de foutopsporing is voltooid, kunt u de mislukte taak opnieuw indienen bij uw Spark in HDInsight-cluster als het project is voltooid.

Volgende stappen

Scenario's

Toepassingen maken en uitvoeren

Tools en uitbreidingen

Resources beheren