Dieser Browser wird nicht mehr unterstützt.
Führen Sie ein Upgrade auf Microsoft Edge durch, um die neuesten Features, Sicherheitsupdates und den technischen Support zu nutzen.
Warum werden unsere Daten vor dem Training bereinigt?
Das Entfernen von Datenzeilen macht unser Modell leistungsfähiger.
Das Bereinigen von Daten hilft bei der Wahl von Features, die die Leistung des Modells verbessern.
Das Entfernen von Zeilen mit Fehlern verhindert eine Irreführung des Trainingsprozesses durch diese Zeilen.
Welche Art von Daten eignet sich am besten für die Codierung mit One-Hot-Vektoren?
Ordinaldaten
Kategorische Daten mit zwei möglichen Werten
Kategorische Daten mit drei oder mehr Werten
Was ist eine Datenstichprobe? Was ist eine Population?
Eine Stichprobe sind alle möglichen Daten, die uns interessieren. Eine Population ist die Teilmenge dieser Daten, die wir tatsächlich zur Hand haben.
Sowohl Population als auch Stichprobe beziehen sich auf Daten, die wir zum Trainieren unseres Modells verwenden.
Eine Population sind alle möglichen Daten, die uns interessieren. Eine Stichprobe ist die Teilmenge dieser Daten, die wir tatsächlich zur Hand haben.
Sie verfügen über ein Modell, das nicht gut funktioniert. Welche der folgenden Optionen trägt definitiv nicht zur Verbesserung der Leistung bei?
Hinzufügen weiterer Beispiele (Zeilen).
Hinzufügen einiger weniger Features (Spalten), von denen Sie wissen, dass sie relevant für das sind, was das Modell vorhersagen soll.
Hinzufügen einer großen Anzahl von Features, von denen Sie wissen, dass sie nicht relevant für das sind, was das Modell vorhersagen möchte
Sie müssen alle Fragen beantworten, bevor Sie Ihre Arbeit überprüfen können.
War diese Seite hilfreich?