Was sind Machine Learning-Modelle?
Das Modell ist die wichtigste Komponente beim maschinellen Lernen und letztendlich das, was Sie erstellen möchten. Ein Modell kann anhand eines Fotos schätzen, wie alt eine Person ist, vorhersagen, welche Inhalte Sie in sozialen Medien anzeigen möchten, oder entscheiden, wohin ein Roboterarm bewegt werden soll. In diesem Szenario möchten wir ein Modell erstellen, das die beste Schuhgröße für einen Hund basierend auf seiner Geschirrgröße schätzen kann.
Modelle können auf zahlreiche unterschiedliche Arten erstellt werden. Ein herkömmliches Modell, das die Flugeigenschaften eines Flugzeugs simuliert, wird beispielsweise von Menschen mit physikalischen und technischen Kenntnissen erstellt. Machine Learning-Modelle sind außergewöhnlich: Sie werden nicht von Menschen angepasst, um optimal zu funktionieren, sondern werden stattdessen mithilfe von Daten optimiert: Sie lernen aus Erfahrungen.
Informationen zu Modellen
Sie können sich ein Modell als Funktion vorstellen, die Daten als Eingabe akzeptiert und eine Ausgabe erzeugt. Genauer gesagt verwendet ein Modell Eingabedaten, um etwas anderes zu schätzen. In diesem Szenario möchten Sie beispielsweise ein Modell erstellen, das eine Geschirrgröße empfängt und damit die Schuhgröße schätzt:
Die Größe des Geschirrs und die der Hundeschuhe sind Daten. Sie sind selbst nicht Teil des Modells. Die Größe des Geschirrs ist die Eingabe, und die Größe der Hundeschuhe ist die Ausgabe.
Modelle sind häufig einfacher Code.
Modelle unterscheiden sich häufig nicht besonders stark von einfachen Funktionen, mit denen Sie bereits vertraut sind. Wie anderer Code enthalten sie Logik und Parameter. Die Logik kann z. B. Geschirrgröße mit parameter_1 multiplizieren lauten:
Wenn „parameter_1“ hier den Wert 2,5 hätte, würde das Modell die Geschirrgröße mit 2,5 multiplizieren und das Ergebnis zurückgeben:
Modell auswählen
Es gibt viele Modelltypen, einfache und äußerst komplexe.
Wie bei jedem Code sind einfachere Modelle oft am zuverlässigsten und am leichtesten zu verstehen, während komplexe Modelle potenziell beeindruckende Leistungen erzielen können. Der ausgewählte Modelltyp hängt von Ihrem Ziel ab. So arbeiten Medizinforscher z. B. häufig mit relativ einfachen Modellen, da sie zuverlässig und intuitiv sind. Im Gegensatz dazu greifen KI-basierte Roboter in der Regel auf komplexe Modelle zurück.
Der erste Schritt beim maschinellen Lernen besteht darin, den Typ des Modells auszuwählen, das Sie verwenden möchten. Wir wählen also ein Modell basierend auf seiner internen Logik aus. Beispielsweise können Sie ein Modell mit zwei Parametern auswählen, um die Schuhgröße des Hundes anhand der Geschirrgröße zu schätzen:
Beachten Sie, dass die Modellauswahl auf der logischen Funktionsweise basiert, nicht auf den Parameterwerten. Tatsächlich wurden die Parameter zu diesem Zeitpunkt noch nicht auf einen bestimmten Wert festgelegt.
Ermitteln der Parameter während des Trainings
Der menschliche Designer wählt keine Parameterwerte aus. Stattdessen werden die Parameterwerte auf eine anfängliche Schätzung festgelegt und dann während eines automatisierten Lernprozesses angepasst, der als Training bezeichnet wird.
Ausgehend vom ausgewählten Modell mit zwei Parametern geben Sie zuerst zufällige Schätzungen für die Parameter an:
Diese zufälligen Parameter bedeuten, dass das Modell nicht gut darin ist, die Schuhgröße zu schätzen, daher führen wir ein Training durch. Während des Trainings werden diese Parameter automatisch in zwei neue Werte geändert, die bessere Ergebnisse liefern:
Wie genau dieser Prozess funktioniert, werden wir im Laufe der Lerneinheit nach und nach erklären.