Feedback oder Verstärkung beim maschinellen Lernen nutzen?

Ich versuche, ein Klassifizierungsproblem zu lösen. Es scheint, dass viele klassische Ansätze einem ähnlichen Paradigma folgen. Das heißt, trainieren Sie ein Modell mit einem Trainingssatz und verwenden Sie es dann, um die Klassenbeschriftungen für neue Instanzen vorherzusagen.

Ich frage mich, ob es möglich ist, einen Feedback-Mechanismus in das Paradigma einzuführen. In der Regelungstheorie ist die Einführung einer Rückkopplungsschleife ein wirksamer Weg, um die Systemleistung zu verbessern.

Momentan denke ich, dass wir zunächst mit einer Reihe von Instanzen beginnen und mit ihnen ein Modell trainieren. Jedes Mal, wenn das Modell eine falsche Vorhersage macht, fügen wir die falsche Instanz zum Trainingssatz hinzu. Dies unterscheidet sich von der blinden Vergrößerung des Trainingssatzes, da es zielgerichteter ist. Dies kann als eine Art angesehen werdenNegative Rückmeldung in der Sprache der Kontrolltheorie.

Gibt es Forschungsergebnisse zum Feedback-Ansatz? Könnte jemand Licht ins Dunkel bringen?

Antworten auf die Frage(3)

Ihre Antwort auf die Frage