Neuen Text zu Sklearn TFIDIF Vectorizer (Python) hinzufügen
Gibt es eine Funktion, die dem vorhandenen Korpus hinzugefügt werden kann? Ich habe meine Matrix bereits generiert und möchte sie regelmäßig zu der Tabelle hinzufügen, ohne den gesamten Sha-Bang erneut zu zermahlen.
z.B
articleList = ['here is some text blah blah','another text object', 'more foo for your bar right now']
tfidf_vectorizer = TfidfVectorizer(
max_df=.8,
max_features=2000,
min_df=.05,
preprocessor=prep_text,
use_idf=True,
tokenizer=tokenize_text
)
tfidf_matrix = tfidf_vectorizer.fit_transform(articleList)
#### ADDING A NEW ARTICLE TO EXISTING SET?
bigger_tfidf_matrix = tfidf_vectorizer.fit_transform(['the last article I wanted to add'])