Как использовать нецелочисленные строковые метки с SVM из scikit-learn? питон

Scikit-learn имеет довольно удобные модули Python для машинного обучения.

Я пытаюсь обучить SVM-тегер для обработки естественного языка (NLP), где мои метки и входные данные - это слова и аннотации. Например. Тегирование части речи вместо использования двойных / целочисленных данных в качестве входных кортежей[[1,2], [2,0]]мои кортежи будут выглядеть так[['word','NOUN'], ['young', 'adjective']]

Кто-нибудь может привести пример того, как я могу использовать SVM со строковыми кортежами? учебник / документация, приведенная здесь, предназначена для целочисленных / двойных входов.http://scikit-learn.org/stable/modules/svm.html

Ответы на вопрос(2)

Ваш ответ на вопрос