Tablice używane jako indeksy muszą być typu całkowitego (lub boolowskiego)
Błędy są następujące:
Traceback (most recent call last):
File "NearestCentroid.py", line 53, in <module>
clf.fit(X_train.todense(),y_train)
File "/usr/local/lib/python2.7/dist-packages/scikit_learn-0.13.1-py2.7-linux-i686.egg/sklearn/neighbors/nearest_centroid.py", line 115, in fit
variance = np.array(np.power(X - self.centroids_[y], 2))
IndexError: arrays used as indices must be of integer (or boolean) type
Kody są następujące:
distancemetric=['euclidean','l2']
for mtrc in distancemetric:
for shrkthrshld in [None]:
#shrkthrshld=0
#while (shrkthrshld <=1.0):
clf = NearestCentroid(metric=mtrc,shrink_threshold=shrkthrshld)
clf.fit(X_train.todense(),y_train)
y_predicted = clf.predict(X_test.todense())
ja używamscikit-learn
pakiet,X-train
, y_train
są w formacie LIBSVM,X
to jest para funkcji: wartość,y_train
jest celem / etykietą,X_train
jest w formacie matrycznym CSR,shrink_threshold
nie obsługuje rzadkiej macierzy CSR, więc dodam.todense()
doX_train
, a potem dostałem ten błąd, czy ktoś może mi pomóc to naprawić? Wielkie dzięki!