Как использовать нецелочисленные строковые метки с SVM из scikit-learn? питон
Scikit-learn имеет довольно удобные модули Python для машинного обучения.
Я пытаюсь обучить SVM-тегер для обработки естественного языка (NLP), где мои метки и входные данные - это слова и аннотации. Например. Тегирование части речи вместо использования двойных / целочисленных данных в качестве входных кортежей[[1,2], [2,0]]
мои кортежи будут выглядеть так[['word','NOUN'], ['young', 'adjective']]
Кто-нибудь может привести пример того, как я могу использовать SVM со строковыми кортежами? учебник / документация, приведенная здесь, предназначена для целочисленных / двойных входов.http://scikit-learn.org/stable/modules/svm.html