Verwenden eines Modells
Im Folgenden wird beschrieben, wie diese Teile zusammenarbeiten, um ein Modell zu trainieren.
Trainieren und Verwenden eines Modells
Es ist wichtig, zwischen dem Trainieren und dem Verwenden eines Modells zu unterscheiden.
Die Verwendung eines Modells bedeutet, Eingaben bereitzustellen und eine Schätzung oder Vorhersage zu erhalten. Dieser Vorgang geschieht sowohl beim Trainieren unseres Modells als auch bei seiner Nutzung durch uns oder unsere Kunden in der realen Welt. Die Verwendung eines Modells dauert normalerweise nur wenige Sekunden.
Im Gegensatz dazu wird beim Trainieren eines Modells die Funktionsweise des Modells verbessert. Für das Training müssen das Modell sowie die Zielfunktion und der Optimierer in einer speziellen Schleife verwendet werden. Das Training kann einige Minuten, aber auch mehrere Tage dauern. Normalerweise wird ein Modell nur einmal trainiert. Nach dem Training kann es beliebig oft verwendet werden, ohne dass weitere Änderungen vorgenommen werden müssen.
In unserem Szenario mit einem Geschäft für Lawinenhunde möchten wir ein Modell mit einem öffentlichen Dataset trainieren. Das Dataset ändert das Modell, sodass es die Schuhgröße eines Hundes basierend auf der Geschirrgröße vorhersagen kann. Nachdem unser Modell trainiert ist, stellen wir mit diesem Modell in unserem Onlineshop sicher, dass die Kunden Hundeschuhe in der richtigen Größe für ihre Hunde kaufen.
Daten für die Verwendung, Daten für das Training
Denken Sie daran, dass ein Dataset eine Sammlung von Informationen zu Objekten oder Dingen ist. Ein Dataset kann beispielsweise Informationen zu Hunden enthalten:
Hunde-ID | Schuhgröße | Geschirrgröße | Hundefarbe | Rasse |
---|---|---|---|---|
0 | 27 | 12 | Brown | Bernhardiner |
1 | 26 | 11 | Schwarz | Labrador |
2 | 25 | 10 | Weiß | Labrador |
3 | 29 | 14 | Schwarz | Schwarzer Schäferhund |
Bei der Verwendung des Modells benötigen Sie nur die Spalten der Daten, die das Modell als Eingabe akzeptiert. Diese Spalten werden als Features bezeichnet. Da in unserem Szenario das Modell die Geschirrgröße akzeptiert und die Schuhgröße schätzt, ist das Feature die Geschirrgröße.
Während des Trainings muss die Zielfunktion in der Regel sowohl die Ausgabe des Modells als auch die richtige Antwort kennen. Diese Werte werden Bezeichnungen genannt. Wenn das Modell in unserem Szenario die Schuhgröße vorhersagt, ist die Schuhgröße unsere Bezeichnung.
Zur Verwendung eines Modells benötigen wir also immer nur Features, während für das Training in der Regel sowohl Features als auch Bezeichnungen erforderlich sind. Während des Trainings für unser Szenario benötigen wir sowohl unser Feature für die Geschirrgröße als auch unsere Bezeichnung für die Schuhgröße. Wenn Sie das Modell auf der Website verwenden, muss nur das Feature „Geschirrgröße“ bekannt sein, denn das Modell schätzt damit die zu verwendende Schuhgröße.
Ich habe das Training abgeschlossen. Was nun?
Nachdem das Training eines Modells abgeschlossen wurde, kann es selbst in einer Datei gespeichert werden. Die ursprünglichen Daten, die Zielfunktion und der Modelloptimierer werden nicht mehr benötigt. Wenn Sie das Modell verwenden möchten, können Sie es vom Datenträger laden und neue Daten bereitstellen. Sie erhalten dann eine Vorhersage.
In der nächsten Übung geht es um das Speichern eines Modells, das Laden des Modells vom Datenträger und um die Modellverwendung in der Praxis. Zur Vervollständigung unseres Szenarios für den Onlineshop nutzen wir außerdem die Ausgaben des Modells, um Kunden zu warnen, wenn sie offenbar die falsche Größe der Hundeschuhe kaufen.