Usando partial_fit con Scikit Pipeline
Como llamaspartial_fit()
en un clasificador scikit-learn envuelto dentro de unaTubería()?
Estoy tratando de construir un clasificador de texto traeable incrementalmente usandoSGDClassifier
me gusta:
from sklearn.linear_model import SGDClassifier
from sklearn.pipeline import Pipeline
from sklearn.feature_extraction.text import HashingVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.multiclass import OneVsRestClassifier
classifier = Pipeline([
('vectorizer', HashingVectorizer(ngram_range=(1,4), non_negative=True)),
('tfidf', TfidfTransformer()),
('clf', OneVsRestClassifier(SGDClassifier())),
])
pero me sale unAttributeError
tratando de llamarclassifier.partial_fit(x,y)
.
Es compatiblefit()
, así que no veo por quépartial_fit()
no está disponible ¿Sería posible realizar una introspección de la tubería, llamar a los transformadores de datos y luego llamar directamentepartial_fit()
en mi clasificador?