Grundlegendes zum Optimieren eines Basismodells
Mithilfe von vortrainierten Open-Source-Basismodellen können Sie Ressourcen sparen. Es kann vorkommen, dass Sie ein Basismodell entsprechend Ihren spezifischen Anforderungen optimieren müssen.
Erkunden der Basismodelle im Modellkatalog
Bei Basismodellen handelt es sich um große Machine Learning-Modelle, die bereits trainiert wurden und als Grundlage für eine Vielzahl von Anwendungsfällen dienen.
In Azure Machine Learning können Sie Open-Source-Basismodelle erkunden, indem Sie den Modellkatalog durchsuchen. Welche Art von Basismodell Sie benötigen, hängt davon ab, wofür Sie das Modell verwenden möchten.
Im Allgemeinen werden Basismodelle für große Datenmengen trainiert und eignen sich für generische Aufgaben wie Sprachverständnis, Texterzeugung und Kontextvorhersagen. Sie sind jedoch möglicherweise nicht die beste Wahl, wenn Sie ein auf eine bestimmte Aufgabe oder Domäne zugeschnittenes Modell benötigen. In solchen Fällen lassen sich durch Optimierung des Basismodells anhand aufgabenspezifischer Daten spezifische Anforderungen erfüllen und bessere Ergebnisse erzielen.
Optimieren von Basismodellen für bestimmte Aufgaben
Auch wenn die Basismodelle bereits Ihren Anforderungen entsprechen, kann es vorkommen, dass Sie ein Basismodell dennoch optimieren müssen.
Basismodelle werden mit einer Vielzahl von Texten aus dem Internet trainiert, sodass sie das allgemeine Language Understanding beherrschen. Durch Optimierung können Sie das Wissen des Modells an eine bestimmte Aufgabe oder einen bestimmten Bereich anpassen und so die Leistung des Modells optimieren und sicherstellen, dass es in diesem speziellen Kontext besonders gut funktioniert.
Allgemeine Aufgaben, für die Sie ein Basismodell optimieren sollten:
- Textklassifizierung: Kategorisierung eines bestimmten Textes in vordefinierte Klassen oder Kategorien auf der Grundlage seines Inhalts oder Kontexts.
- Tokenklassifizierung: Zuweisung bestimmter Bezeichnungen oder Tags zu einzelnen Token oder Wörtern in einem Text. Wird häufig bei Aufgaben wie der Erkennung benannter Entitäten verwendet.
- Fragen und Antworten: Passende und sinnvolle Antworten auf Fragen, die in natürlicher Sprache gestellt werden.
- Zusammenfassung: Erstellung prägnanter und kohärenter Zusammenfassungen längerer Texte, in denen die wesentlichen Informationen enthalten sind.
- Übersetzung: Konvertierung von Texten von einer Sprache in eine andere unter Beibehaltung der Bedeutung und des Kontexts.
Da Basismodelle bereits vortrainiert sind, wird zum Optimieren des Basismodells nur ein kleineres aufgabenspezifisches Dataset benötigt. Wenn Sie ein Modell optimieren, benötigen Sie wahrscheinlich weniger Daten und Computeleistung, als wenn Sie ein Modell von Grund auf neu trainieren würden.
Sie können ein Basismodell aus dem Modellkatalog in Azure Machine Learning optimieren. Sie benötigen nur ein kleines Dataset und einen GPU-Cluster, um ein Modell zu optimieren.