Scikit Learn - ValueError: Array contém NaN ou infinito
Não há NaNs no meu conjunto de dados, verifiquei completamente. Alguma razão pela qual eu continuo recebendo este erro ao tentar encaixar meu classificador? Alguns dos números no conjunto de dados são bastante grandes e algumas casas decimais saem 10 pontos decimais, mas eu não gostaria que isso causasse um erro. Eu incluí algumas das informações do DataFrame do meu pandas abaixo, bem como o erro em si. Alguma ideia?
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 6244 entries, 1985-02-06 00:00:00 to 2009-11-05 00:00:00
Data columns (total 86 columns):
dtypes: float64(86)
clf = RandomForestClassifier(n_estimators=100,min_samples_split=4)
clf.fit(train, train_target)
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-150-fa4acb362bc6> in <module>()
1 clf = RandomForestClassifier(n_estimators=100,min_samples_split=4)
----> 2 clf.fit(train, train_target)
3 clf.score(test, test_target)
C:\Anaconda\lib\site-packages\sklearn\ensemble\forest.pyc in fit(self, X, y, sample_weight)
255 # Convert data
256 X, = check_arrays(X, dtype=DTYPE, sparse_format="dense",
--> 257 check_ccontiguous=True)
258
259 # Remap output
C:\Anaconda\lib\site-packages\sklearn\utils\validation.pyc in check_arrays(*arrays, **options)
231 else:
232 array = np.asarray(array, dtype=dtype)
--> 233 _assert_all_finite(array)
234
235 if copy and array is array_orig:
C:\Anaconda\lib\site-packages\sklearn\utils\validation.pyc in _assert_all_finite(X)
25 if (X.dtype.char in np.typecodes['AllFloat'] and not np.isfinite(X.sum())
26 and not np.isfinite(X).all()):
---> 27 raise ValueError("Array contains NaN or infinity.")
28
29
ValueError: Array contains NaN or infinity.