Масштабирование цели приводит к нарушению регрессии SVM Scikit-learn

Question

Aug 31, 2014, 05:46 PM

scaling scikit-learn regression python svm

Масштабирование цели приводит к нарушению регрессии SVM Scikit-learn

При обучении регрессии SVM обычно желательно масштабировать входные характеристики перед тренировкой.

Но как насчет масштабирования целей? Обычно это не считается необходимым, и я не вижу веской причины, почему это необходимо.

Однако в примере scikit-learn для регрессии SVM из:http://scikit-learn.org/stable/auto_examples/svm/plot_svm_regression.html

Просто введя строку y = y / 1000 перед тренировкой, прогноз прекратится до постоянного значения. Масштабирование целевой переменной перед тренировкой решит проблему, но я не понимаю, зачем это нужно.

Что вызывает эту проблему?

import numpy as np
from sklearn.svm import SVR
import matplotlib.pyplot as plt

# Generate sample data
X = np.sort(5 * np.random.rand(40, 1), axis=0)
y = np.sin(X).ravel()

# Add noise to targets
y[::5] += 3 * (0.5 - np.random.rand(8))

# Added line: this will make the prediction break down
y=y/1000

# Fit regression model
svr_rbf = SVR(kernel='rbf', C=1e3, gamma=0.1)
svr_lin = SVR(kernel='linear', C=1e3)
svr_poly = SVR(kernel='poly', C=1e3, degree=2)
y_rbf = svr_rbf.fit(X, y).predict(X)
y_lin = svr_lin.fit(X, y).predict(X)
y_poly = svr_poly.fit(X, y).predict(X)

# look at the results
plt.scatter(X, y, c='k', label='data')
plt.hold('on')
plt.plot(X, y_rbf, c='g', label='RBF model')
plt.plot(X, y_lin, c='r', label='Linear model')
plt.plot(X, y_poly, c='b', label='Polynomial model')
plt.xlabel('data')
plt.ylabel('target')
plt.title('Support Vector Regression')
plt.legend()
plt.show()

Масштабирование цели приводит к нарушению регрессии SVM Scikit-learn

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Масштабирование цели приводит к нарушению регрессии SVM Scikit-learn

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы