Freigeben über


Synthetische Datengenerierung in Azure KI Studio

In Azure KI Studio können Sie die synthetische Datengenerierung nutzen, um effizient Vorhersagen für Ihre Datasets zu erzeugen. In diesem Artikel wird das Konzept der synthetischen Datengenerierung und deren Verwendung für maschinelles Lernen erläutert.

Worum handelt es sich bei der synthetischen Datengenerierung?

Die synthetische Datengenerierung umfasst das Erstellen von künstlichen Daten, die die statistischen Eigenschaften von realen Daten nachahmen. Diese Daten werden durch Algorithmen und Techniken aus dem Bereich des maschinellen Lernens generiert. Sie können die Daten auf verschiedene Weise verwenden (z. B. für Computersimulationen oder zum Modellieren von realen Ereignissen).

Vorteile

Beim maschinellen Lernen sind synthetische Daten für Folgendes wichtig:

  • Datenerweiterung: Sie helfen bei der Erweiterung der Größe von Trainingsdatasets, was für das Training robuster Machine Learning-Modelle von entscheidender Bedeutung ist. Diese Erweiterungstechnik ist besonders nützlich, wenn reale Daten knapp oder teuer sind.

  • Tests und Validierung: Die Daten ermöglichen umfangreiche Tests und Validierungen von Machine Learning-Modellen in verschiedenen Szenarios, ohne dass reale Daten erforderlich sind.

Beispielnotebook

Um herauszufinden, wie synthetische Daten generiert werden, können Sie das Beispielnotebook verwenden.