Einbeziehen von Benutzer-Feedback in ein ML-Modell

Ich habe ein ML-Modell für eine NLP-Klassifizierungsaufgabe (0/1) entwickelt und in der Produktionsumgebung bereitgestellt. Die Vorhersage des Modells wird den Benutzern angezeigt, und die Benutzer haben die Möglichkeit, eine Rückmeldung zu geben (wenn die Vorhersage richtig / falsch war).

Wie kann ich dieses Feedback kontinuierlich in mein Modell integrieren? Unter UX-Gesichtspunkten möchten Sie nicht, dass ein Benutzer das System mehr als zweimal / dreimal für eine bestimmte Eingabe korrigiert / lehrt. Das System sollte schnell lernen, d. H., Das Feedback sollte "schnell" aufgenommen werden. (Google Priority Inbox erledigt dies nahtlos.)

Wie baut man diese "Rückkopplungsschleife" auf, mit der sich mein System verbessern lässt? Ich habe viel im Internet gesucht, aber kein relevantes Material gefunden. Hinweise werden von großer Hilfe sein.

Pls sagen nicht, dass Sie das Modell von Grund auf neu trainieren, indem Sie neue Datenpunkte hinzufügen. Das ist sicherlich nicht, wie Google und Facebook ihre intelligenten Systeme bauen

Um meine Frage näher zu erläutern, denken Sie an den Spam-Detektor von Google, an deren Prioritäts-Posteingang oder an die neuesten Funktionen von "Smart Replies". Es ist eine bekannte Tatsache, dass sie die Fähigkeit haben, (schnelle) Benutzer-Feeds zu lernen / aufzunehmen.

Währenddessen, wenn es das Benutzerfeedback schnell einbezieht (dh der Benutzer muss dem System die korrekte Ausgabe mindestens 2-3 Mal pro Datenpunkt beibringen und das System beginnt, die korrekte Ausgabe für diesen Datenpunkt zu geben) UND es stellt auch sicher, dass alte Erkenntnisse beibehalten werden und fängt nicht an, falsche Ausgaben auf älteren Datenpunkten zu geben (wo es früher richtige Ausgaben gab), während das Lernen von neuen Datenpunkten einbezogen wird.

Ich habe kein Blog / Literatur / Diskussion w.r.t gefunden, wie man solche Systeme baut - Ein intelligentes System, das in Detaieedback-Schleife erklärt "in ML-Systemen

Hoffentlich ist meine Frage jetzt etwas klarer.

Update: Einige verwandte Fragen, die ich gefunden habe, sind:

Unterstützt die SVM in sklearn inkrementelles (Online-) Lernen?

https: //datascience.stackexchange.com/questions/1073/libraries-for-online-machine-learnin

http: //mlwave.com/predicting-click-through-rates-with-online-machine-learning

https: //en.wikipedia.org/wiki/Concept_drif

Update: Ich habe noch keine konkrete Antwort, aber es gibt ein solches Rezept. Lesen Sie den Abschnitt "Aus dem Feedback lernen" im folgenden BlogMachine Learning! = Lernmaschine. In diesem Artikel spricht Jean über "Hinzufügen einer Rückkopplungsschleife zur Maschine". Gleich inHie, Hie, Hie4.

Antworten auf die Frage(4)

Ihre Antwort auf die Frage