Wie verwende ich mit SVM von scikit-learn nicht ganzzahlige Zeichenfolgenbezeichnungen? Python

Question

Oct 18, 2012, 04:53 AM

Wie verwende ich mit SVM von scikit-learn nicht ganzzahlige Zeichenfolgenbezeichnungen? Python

Scikit-learn verfügt über recht benutzerfreundliche Python-Module für maschinelles Lernen.

Ich versuche, einen SVM-Tagger für Natural Language Processing (NLP) zu trainieren, bei dem meine Bezeichnungen und Eingabedaten Wörter und Anmerkungen sind. Z.B. Part-Of-Speech-Tagging, anstatt Double / Integer-Daten als Eingabetupel zu verwenden[[1,2], [2,0]]Meine Tupel werden so aussehen[['word','NOUN'], ['young', 'adjective']]

Kann jemand ein Beispiel geben, wie ich die SVM mit String-Tupeln verwenden kann? Das hier angegebene Tutorial / die Dokumentation gelten für Integer- / Double-Eingaben.http://scikit-learn.org/stable/modules/svm.html