Результаты поиска по запросу "scikit-learn"

1 ответ

Кроме того, вы должны знать, что использование пользовательской функции Python в качестве метрики, как правило, слишком медленное, чтобы быть полезным, из-за издержек обратных вызовов Python при обходе дерева.

у использовать 'KDtree' (это лучший вариант. Другие алгоритмы 'KNN' не оптимальны для моего проекта) с пользовательской метрикой расстояния. Я проверил некоторые ответы здесь на похожие вопросы, и это должно работать ... но не работает. Аргумент ...

1 ответ

Значение ключа принимает метку столбца panda dataframe. При использовании в вашем конвейере его можно применять как:

я есть Dataframe, который можно упростить до этого: import pandas as pd df = pd.DataFrame([{ 'title': 'batman', 'text': 'man bat man bat', 'url': 'batman.com', 'label':1}, {'title': 'spiderman', 'text': 'spiderman man spider', 'url': ...

3 ответа

он работает нормально, как показать X в формате данных? я

ько начал изучать машинное обучение, когда выполняя одно из заданий, я получаю ошибку значения, но я следовал тем же шагам, что и инструктор. Я получаю ошибку значения, пожалуйста, помогите. ДФФ Country Name 0 AUS Sri 1 USA Vignesh 2 IND Pechi ...

ТОП публикаций

2 ответа

Большое спасибо за детали!

аюсь впервые использовать featureunion в конвейере sklearn, чтобы объединить числовые (2 столбца) и текстовые (1 столбец) для классификации нескольких классов. from sklearn.preprocessing import FunctionTransformer from sklearn.pipeline import ...

1 ответ

stackoverflow.com/q/47561759/3666197

редложено вэтот ответ [https://stackoverflow.com/questions/29589327/train-multiple-models-in-parallel-with-sklearn] Я пытался использовать joblib для параллельного обучения нескольких моделей scikit-learn. import joblib import numpy from sklearn ...

2 ответа

Хотел бы я пометить это как ответ тоже. Ранее я заметил, что в наборе данных было больше нулей. Это объясняет высокую точность оценки. Еще раз спасибо!

ощьюLogisticRegression класс вscikit-learn по версиинабор данных задержки рейса [https://www.kaggle.com/usdot/flight-delays/data]. я используюpandas выбрать несколько столбцов: df = df[["MONTH", "DAY_OF_MONTH", "DAY_OF_WEEK", "ORIGIN", ...

2 ответа

Матрица путаницы принимает вектор меток (а не одноразовое кодирование). Ты должен бежать

multilabel-indicator is not supportedсообщение об ошибке при попытке запустить: confusion_matrix(y_test, predictions) y_test этоDataFrame которая имеет форму: Horse | Dog | Cat 1 0 0 0 1 0 0 1 0 ... ... ...predictions этоnumpy array: [[1, 0, ...

1 ответ

 для регрессии. Смотрите заголовок: «Параметры задачи обучения»

ичок в XGBoost в Python, поэтому я прошу прощения, если ответ здесь очевиден, но я пытаюсь взять panda dataframe и получить XGBoost в Python, чтобы дать мне те же прогнозы, которые я получаю, когда использую оболочку Scikit-Learn для того же ...

2 ответа

Спасибо! Это одно из самых понятных объяснений, которые я прочитал.

ользую векторный классификатор поддержки из sklearn в наборе данных Iris. Когда я звонюdecision_function возвращает отрицательные значения. Но все образцы в тестовом наборе данных после классификации имеют правильный класс. Я думаю, ...

1 ответ

Также обязательно сделайте этот анализ перед применением масштабирования и нормализации.

ользую Scikit-Learn для классификации текста. Я хочу рассчитать информационное усиление для каждого атрибута относительно класса в (разреженной) матрице термина документа. Информационное усиление определяется как H (Класс) - H (Класс | Атрибут), ...