Результаты поиска по запросу "scikit-learn"
Это просто воспроизводимый пример, предназначенный для демонстрации моей проблемы и, очевидно, не моего реального кода ... Я знаю о различных настройках дерева решений, тем не менее, в sklearn на данный момент просто отсутствуют какие-либо опции после сокращения.
ользую sklearn.tree.DecisionTreeClassifier для построения дерева решений. При оптимальных настройках параметров я получаю дерево с ненужными листьями (см. примеррисунок ниже - мне не нужны вероятности, поэтому листовые узлы, отмеченные красным, ...
Как скачать наборы данных для sklearn? - питон
В НЛТК естьnltk.download() функция для загрузки наборов данных, которые входят в комплект NLP. В sklearn говорится о загрузке наборов данных ( http://scikit-learn.org/stable/datasets/ [http://scikit-learn.org/stable/datasets/]) и получение ...
Как прогнозировать временные ряды в scikit-learn?
Scikit-learn использует очень удобный подход, основанный наfit а такжеpredict методы. У меня есть данные временных рядов в формате, подходящем дляfit а такжеpredict. Например у меня есть следующееXs: [[1.0, 2.3, 4.5], [6.7, 2.7, 1.2], ..., ...
Теперь масштабируйте ваши значения:
идея, почему спарк будет делать это дляStandardScaler? Согласно определениюStandardScaler: StandardScaler стандартизирует набор функций, чтобы иметь нулевое среднее значение и стандартное отклонение 1. Флаг withStd будет масштабировать данные ...
ValueError: unknown не поддерживается в sklearn.RFECV
Я пытался сузить число функций, действительно релевантных для моего классификатора, используя rfecv. Это код, который я написал import sklearn import pandas as p import numpy as np import scipy as sp import pylab as pl from sklearn import ...
Используйте scikit-learn TfIdf с Gensim LDA
Я использовал различные версии TFIDF в scikit, чтобы научиться моделировать некоторые текстовые данные. vectorizer = TfidfVectorizer(min_df=1,stop_words='english')Полученные данные X имеют следующий формат: <rowsxcolumns sparse matrix of type ...
OrdinalEncoder
я есть двумерный массив, как показано ниже: a=np.array([["Science", "Blue", 3], ["Math", "Red", 4], ["Math", "Red", 5], ["Science", "Red", 3]])И мне нужно преобразовать его в столбец числовых значений, как показано ниже (желаемый ...
И действительно, вы можете использовать весь набор данных для окончательного обучения, как указано в вопросе о данных.
аюсь решить проблему регрессии наБостонский набор данных [https://www.kaggle.com/c/boston-housing]с помощьюслучайный лесной регрессор [https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestRegressor.html] Я ...
Самая быстрая попарная метрика расстояния в питоне
У меня есть одномерный массив чисел, и я хочу вычислить все попарно евклидовы расстояния. У меня есть метод (благодаря SO) сделать это с вещанием, но он неэффективен, потому что он рассчитывает каждое расстояние дважды. И это ...
Это сэкономило мое время. Спасибо
ался исправить еще одну проблему, когда я пытался сделатьpip uninstall scikit-learn После этого я получил красный текст, такой как: pip install --upgrade pip Error checking for conflicts. Traceback (most recent call last): ...