¿Cómo utilizo etiquetas de cadena no enteras con SVM de scikit-learn? Pitón

Question

Oct 18, 2012, 04:53 AM

¿Cómo utilizo etiquetas de cadena no enteras con SVM de scikit-learn? Pitón

Scikit-learn tiene módulos Python bastante fáciles de usar para el aprendizaje automático.

Estoy tratando de entrenar a un etiquetador SVM para el procesamiento de lenguaje natural (NLP) donde mis etiquetas y datos de entrada son palabras y anotaciones. P.ej. Etiquetado de parte de la voz, en lugar de utilizar datos dobles / enteros como tuplas de entrada[[1,2], [2,0]]mis tuplas se verán así[['word','NOUN'], ['young', 'adjective']]

¿Alguien puede dar un ejemplo de cómo puedo usar el SVM con tuplas de cadena? El tutorial / documentación que se proporciona aquí es para entradas enteras / dobles.http://scikit-learn.org/stable/modules/svm.html