Добавление нового текста в Sklearn TFIDIF Vectorizer (Python)
Есть ли функция для добавления в существующий корпус? Я уже сгенерировал свою матрицу, я хочу периодически добавлять в таблицу, не переусердствовав весь sha-bang
например;
articleList = ['here is some text blah blah','another text object', 'more foo for your bar right now']
tfidf_vectorizer = TfidfVectorizer(
max_df=.8,
max_features=2000,
min_df=.05,
preprocessor=prep_text,
use_idf=True,
tokenizer=tokenize_text
)
tfidf_matrix = tfidf_vectorizer.fit_transform(articleList)
#### ADDING A NEW ARTICLE TO EXISTING SET?
bigger_tfidf_matrix = tfidf_vectorizer.fit_transform(['the last article I wanted to add'])