Udostępnij za pośrednictwem


Usługa HDInsight w usłudze AKS — często zadawane pytania

Ten artykuł zawiera odpowiedzi na kilka typowych pytań dotyczących usługi Azure HDInsight w usłudze AKS.

Uwaga

Wycofamy usługę Azure HDInsight w usłudze AKS 31 stycznia 2025 r. Przed 31 stycznia 2025 r. należy przeprowadzić migrację obciążeń do usługi Microsoft Fabric lub równoważnego produktu platformy Azure, aby uniknąć nagłego zakończenia obciążeń. Pozostałe klastry w ramach subskrypcji zostaną zatrzymane i usunięte z hosta.

Tylko podstawowa pomoc techniczna będzie dostępna do daty wycofania.

Ważne

Ta funkcja jest aktualnie dostępna jako funkcja podglądu. Dodatkowe warunki użytkowania dla wersji zapoznawczych platformy Microsoft Azure obejmują więcej warunków prawnych, które dotyczą funkcji platformy Azure, które znajdują się w wersji beta, w wersji zapoznawczej lub w inny sposób nie zostały jeszcze wydane w wersji ogólnodostępnej. Aby uzyskać informacje o tej konkretnej wersji zapoznawczej, zobacz Informacje o wersji zapoznawczej usługi Azure HDInsight w usłudze AKS. W przypadku pytań lub sugestii dotyczących funkcji prześlij żądanie w usłudze AskHDInsight , aby uzyskać szczegółowe informacje i postępuj zgodnie z nami, aby uzyskać więcej aktualizacji w społeczności usługi Azure HDInsight.

Ogólne

  • Co to jest usługa HDInsight w usłudze AKS?

    Usługa HDInsight w usłudze AKS to nowa wersja usługi HDInsight, która udostępnia gotową dla przedsiębiorstw usługę klastra zarządzanego z pojawiającymi się projektami analitycznymi typu open source, takimi jak Apache Flink (na potrzeby przesyłania strumieniowego), Trino (na potrzeby analizy adhoc i analizy biznesowej) i apache Spark. Aby uzyskać więcej informacji, zobacz Omówienie.

  • Jakie kształty klastra obsługują usługę HDInsight w usłudze AKS?

    Usługa HDInsight w usłudze AKS obsługuje platformy Trino, Apache Flink i Apache Spark, aby rozpocząć od. Jednak inne kształty klastra, takie jak Kafka, Hive itp., są w harmonogramie działania.

  • Jak mogę rozpocząć pracę z usługą HDInsight w usłudze AKS?

    Aby rozpocząć, odwiedź witrynę Azure Marketplace i wyszukaj usługę Azure HDInsight w usłudze AKS i zapoznaj się z artykułem Wprowadzenie.

  • Co się stanie z istniejącą usługą HDInsight na maszynie wirtualnej i klastrami, które obecnie uruchamiam?

    Brak zmian w istniejącej usłudze HDInsight (HDInsight na maszynie wirtualnej). Wszystkie istniejące klastry nadal działają i można nadal tworzyć i skalować nowe klastry usługi HDInsight.

  • Który system operacyjny jest obsługiwany w usłudze HDInsight w usłudze AKS?

    Usługa HDInsight w usłudze AKS jest oparta na systemie operacyjnym Mariner. Aby uzyskać więcej informacji, zobacz Wersja systemu operacyjnego.

  • W jakich regionach są dostępne usługi HDInsight w usłudze AKS?

    Aby uzyskać listę obsługiwanych regionów, zobacz Dostępność regionów.

  • Jaki jest koszt wdrożenia usługi HDInsight w klastrze usługi AKS?

    Aby uzyskać więcej informacji na temat cen, zobacz cennik usługi HDInsight w usłudze AKS.

Zarządzanie klastrem

  • Czy mogę uruchomić wiele klastrów jednocześnie?

    Tak, można uruchomić dowolną liczbę klastrów jednocześnie dla puli klastrów. Upewnij się jednak, że nie ograniczasz limitu przydziału dla subskrypcji. Maksymalna liczba węzłów dozwolonych w puli klastrów to 250 (w publicznej wersji zapoznawczej).

  • Czy mogę zainstalować lub dodać więcej wtyczek/bibliotek w klastrze?

    Tak, można zainstalować niestandardowe wtyczki i biblioteki w zależności od kształtów klastra.

  • Czy mogę połączyć się z klastrem za pomocą protokołu SSH?

    Tak, możesz połączyć się z klastrem za pośrednictwem protokołu Webssh i wykonywać zapytania i przesyłać zadania bezpośrednio z tego miejsca.

Magazyn metadanych

  • Czy mogę nawiązać połączenie z klastrem za pomocą zewnętrznego magazynu metadanych?

    Tak, możesz użyć zewnętrznego magazynu metadanych. Obsługujemy jednak tylko usługę Azure SQL Database jako zewnętrzny niestandardowy magazyn metadanych.

  • Czy mogę udostępnić magazyn metadanych w wielu klastrach?

    Tak, możesz udostępnić magazyn metadanych w wielu usługach HDInsight usługi AKS.

  • Jaka jest obsługiwana wersja magazynu metadanych Hive?

    Magazyn metadanych Hive w wersji 3.1.2

Pakiety robocze

Trino

  • Co to jest Trino?

    Trino to federacyjny i rozproszony aparat zapytań SQL typu open source, który umożliwia wykonywanie zapytań dotyczących danych znajdujących się w różnych źródłach danych bez przechodzenia do centralnego magazynu danych. Możesz wykonywać zapytania dotyczące danych przy użyciu języka ANSI SQL. Nie trzeba uczyć się nowego języka. Aby uzyskać więcej informacji, zobacz Trino overview (Omówienie trino).

  • Jakie wszystkie łączniki obsługujesz?

    Usługa HDInsight w usłudze AKS Trino obsługuje wiele łączników. Aby uzyskać więcej informacji, zobacz tę listę łączników Trino. Ciągle dodajemy nowe łączniki jako i gdy nowe łączniki są dostępne w wersji typu open source.

  • Czy mogę dodać wykazy do istniejącego klastra?

    Tak, można dodać obsługiwane wykazy do istniejącego klastra. Aby uzyskać więcej informacji, zobacz Dodawanie wykazów do istniejącego klastra.

  • Co to jest apache Flink?

    Apache Flink to najlepszy w klasie aparat analityczny typu open source do przetwarzania strumienia i wykonywania stanowych obliczeń na niezwiązanych i ograniczonych strumieniach danych. Może wykonywać obliczenia z szybkością w pamięci i w dowolnej skali. Funkcja Flink w usłudze HDInsight w usłudze AKS oferuje zarządzane narzędzie Apache Flink typu open source. Aby uzyskać więcej informacji, zobacz Flink overview (Omówienie linku Flink).

  • Czy obsługujesz zarówno sesję, jak i tryb aplikacji w narzędziu Apache Flink?

    W usłudze HDInsight w usłudze AKS funkcja Flink obsługuje obecnie klastry trybu sesji.

  • Co to jest zarządzanie zapleczem stanu i jak jest wykonywane w usłudze HDInsight w usłudze AKS?

    Zaplecza określają, gdzie jest przechowywany stan. Po aktywowaniu punktów kontrolnych stan jest utrwalany po punktach kontrolnych w celu ochrony przed utratą danych i spójnym odzyskiwaniem. Sposób, w jaki stan jest reprezentowany wewnętrznie i jak i gdzie są utrwalane po punktach kontrolnych, zależy od wybranego zaplecza stanu. Aby uzyskać więcej informacji, zobacz Flink overview (Omówienie linku Flink)

Apache Spark

  • Co to jest platforma Apache Spark?

    Apache Spark to struktura przetwarzania danych, która może szybko wykonywać zadania przetwarzania na dużych zestawach danych, a także dystrybuować zadania przetwarzania danych na wielu komputerach , na własnych lub w połączeniu z innymi narzędziami do przetwarzania rozproszonego.

  • Jakie interfejsy API języka są obsługiwane na platformie Spark?

    Usługa Azure HDInsight w usłudze AKS obsługuje języki Python i Scala.

  • Czy zewnętrzny magazyn metadanych jest obsługiwany w usłudze HDInsight na platformie AKS Spark?

    Usługa HDInsight w usłudze AKS obsługuje łączność zewnętrznego magazynu metadanych. Obecnie tylko usługa Azure SQL DB jest obsługiwana jako zewnętrzny magazyn metadanych.

  • Jakie są różne sposoby przesyłania zadań w usłudze HDInsight na platformie AKS Spark?

    Zadania można przesyłać w usłudze HDInsight na platformie AKS Spark przy użyciu notesu Jupyter Notebook, notesu Zeppelin, zestawu SDK i terminalu klastra. Aby uzyskać więcej informacji, zobacz Submit and Manage Jobs on a Spark cluster in HDInsight on AKS (Przesyłanie zadań i zarządzanie nimi w klastrze Spark w usłudze HDInsight w usłudze AKS)