Einführung

Abgeschlossen

Die Art und Weise, wie wir Modelle trainieren, ist alles andere als ein perfekt automatisierter Prozess. Beim Training kann das blinde Vertrauen in Daten dazu führen, dass die Modelle Dinge lernen, die letztlich nicht von Nutzen sind, oder dass die wirklich wichtigen Dinge nicht effizient gelernt werden. Im folgenden Lernmaterial werden einige einfache Gründe für die Unter- und Überanpassung sowie mögliche Abhilfemaßnahmen erläutert.

Szenario: Trainieren von Lawinenrettungshunden

In diesem Modul verwenden wir das folgende Beispielszenario, um die Unter- und Überanpassung zu erklären. Dieses Szenario soll Ihnen ein Beispiel dafür geben, wie Sie diese Konzepte beim Programmieren für sich selbst umsetzen können. Beachten Sie, dass diese Prinzipien im Allgemeinen für fast alle Arten von Modellen gelten, nicht nur für die, mit denen wir hier arbeiten.

Es ist an der Zeit, dass Ihre Hilfsorganisation eine neue Generation von Hunden darin ausbildet, wie man Wanderer findet, die von Lawinen verschüttet wurden. Im Büro wird darüber diskutiert, welche Hunde am besten geeignet sind – ist ein großer Hund besser als ein kleiner Hund? Sollten die Hunde trainiert werden, wenn sie noch jung sind oder wenn sie schon etwas älter sind? Glücklicherweise liegen Ihnen Statistiken über die in den letzten Jahren durchgeführten Rettungsaktionen vor, auf die Sie zurückgreifen können. Die Ausbildung von Hunden ist jedoch teuer. Sie müssen also sicher sein, dass Ihre Kriterien für die Auswahl der Hunde geeignet sind.

Voraussetzungen

  • Erfahrung mit Machine Learning-Modellen

Lernziele

In diesem Modul wird Folgendes thematisiert:

  • Definieren der Featurenormalisierung
  • Erstellen von und Arbeiten mit Testdatasets
  • Erläutern, wie Testmodelle das Training sowohl verbessern als auch beeinträchtigen können