Обновление имен функций в Scikit TFIdfVectorizer

Я пробую этот код

from sklearn.feature_extraction.text import TfidfVectorizer
import numpy as np

train_data = ["football is the sport","gravity is the movie", "education is imporatant"]
vectorizer = TfidfVectorizer(sublinear_tf=True, max_df=0.5,
                                                 stop_words='english')

print "Applying first train data"
X_train = vectorizer.fit_transform(train_data)
print vectorizer.get_feature_names()

print "\n\nApplying second train data"
train_data = ["cricket", "Transformers is a film","AIMS is a college"]
X_train = vectorizer.transform(train_data)
print vectorizer.get_feature_names()

print "\n\nApplying fit transform onto second train data"
X_train = vectorizer.fit_transform(train_data)
print vectorizer.get_feature_names()

Выход для этого

Applying first train data
[u'education', u'football', u'gravity', u'imporatant', u'movie', u'sport']


Applying second train data
[u'education', u'football', u'gravity', u'imporatant', u'movie', u'sport']


 Applying fit transform onto second train data
[u'aims', u'college', u'cricket', u'film', u'transformers']

Я передал первый набор данных, используя fit_transform, векторизатору, чтобы он дал мне такие имена функций, как[u'education', u'football', u'gravity', u'imporatant', u'movie', u'sport'] после этого я применил другой набор поездов к тому же векторизатору, но он дал мне те же имена объектов, что и я не использовал fit или fit_transform. Но я хочу знать, как обновить функции векторизатора, не перезаписывая предыдущие онки. Если я снова использую fit_transform, предыдущие функции будут перезаписаны. Поэтому я хочу обновить список возможностей векторизатора. Так что я хочу что-то вроде[u'education', u'football', u'gravity', u'imporatant', u'movie', u'sport',u'aims', u'college', u'cricket', u'film', u'transformers'] Как я могу получить это.

Ответы на вопрос(2)

Ваш ответ на вопрос