Tworzenie rozwiązań do analizy w ramach oprogramowania typu open source za pomocą usługi Azure HDInsight

Średni
Data Engineer
Data Scientist
Azure HDInsight

W ramach tej ścieżki szkoleniowej osoba ucząca się zostanie wprowadzona do usługi HDInsight i jak zastosować tę technologię w celu rozwiązania szeregu rzeczywistych wyzwań.

Wymagania wstępne

Należy spełnić następujące wymagania wstępne

  • Pomyślne zalogowanie się w witrynie Azure Portal
  • Uzyskanie informacji na temat opcji usługi Azure Storage
  • Uzyskanie informacji na temat opcji obliczeniowych platformy Azure

Moduły w ramach tej ścieżki szkoleniowej

Na końcu tego modułu dowiesz się, że usługa Azure HDInsight jest w pełni zarządzaną usługą w chmurze, która umożliwia efektywne przetwarzanie ogromnych ilości danych przy użyciu najpopularniejszych platform typu open source.

W tym module poznasz różne konfiguracje zapewniające optymalne wykorzystanie usługi HDInsight zarówno z perspektywy wydajności, jak i kosztów.

W tym module dowiesz się, jak utworzyć klaster usługi HDInsight, monitorować klaster i pamiętać o typowych problemach z aprowizowaniem.

Dowiedz się, jak baza HBase zapewnia dostęp losowy i silną spójność dla dużych ilości danych bez struktury i częściowo ustrukturyzowanych w schemacie mniej bazy danych zorganizowanej według rodzin kolumn.

W tym module dowiesz się, jak tworzyć potoki i aplikacje analizy danych przesyłanych strumieniowo w czasie rzeczywistym w chmurze przy użyciu usługi Azure HDInsight z platformami Apache Kafka i Apache Spark.

Po ukończeniu tego modułu można wykonywać zapytania ad hoc na zestawie danych big data. Użycie interakcyjnego zapytania usługi HDInsight pomaga osiągnąć opóźnienia zapytania podrzędnego.

Usługa Azure HDInsight z innymi usługami platformy Azure zapewnia kompleksowe wielowarstwowe rozwiązanie zabezpieczeń i jest wspólną odpowiedzialnością między firmą Microsoft a klientem.