Mesclando o classificador de scikits bag-of-words com campos numéricos arbitrários

Question

Nov 20, 2013, 10:01 PM

Mesclando o classificador de scikits bag-of-words com campos numéricos arbitrários

Como você iria mesclar um scikits-learnclassificador que opera sobre um saco de palavras com um que opera em campos numéricos arbitrários?

Eu sei que estas são basicamente a mesma coisa por trás das cenas, mas estou tendo problemas para descobrir como fazer isso através dos métodos de biblioteca existentes. Por exemplo, meu classificador de saco de palavras usa o pipeline:

classifier = Pipeline([
    ('vectorizer', HashingVectorizer(ngram_range=(1,4), non_negative=True)),
    ('tfidf', TfidfTransformer()),
    ('clf', OneVsRestClassifier(LinearSVC())),
])
classifier.fit(['some random text','some other text', ...], [CLS_A, CLS_B, ...])

Considerando que meu outro uso é como:

classifier = LinearSVC()
classifier.fit([1.23, 4.23, ...], [CLS_A, CLS_B, ...])

Como eu construiria um classificador LinearSVC que poderia ser treinado usando os dois conjuntos de dados simultaneamente? por exemplo.

classifier = ?
classifier.fit([('some random text',1.23),('some other text',4.23), ...], [CLS_A, CLS_B, ...])

questionAnswers(1)

Perguntas populares

0 a resposta

File download no botão clique?

0 a resposta

Quais editores gratuitos do Powershell posso usar no Windows XP SP2?

0 a resposta

como obter detalhes de várias tabelas?

0 a resposta

Por que IEnumerable <T> herda de IEnumerable?

0 a resposta

Por que existe um limite no tamanho da pilha? [duplicado

Você é muito ativo! É ótimo!

Mesclando o classificador de scikits bag-of-words com campos numéricos arbitrários

questionAnswers(1)

yourAnswerToTheQuestion

Perguntas populares