Результаты поиска по запросу "scikit-learn"
sklearn.LabelEncoder с невиданными ранее значениями
Еслиsklearn.LabelEncoder был установлен на тренировочном наборе, он может сломаться, если встретится с новыми значениями при использовании на тестовом наборе. Единственное решение, которое я мог бы предложить для этого, - сопоставить все новое в ...
Python Соотнесение кластера k-средних с экземпляром
Я прочитал документыВот [http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html]а также глядя наэто [http://fromdatawithlove.thegovans.us/2013/05/clustering-using-scikit-learn.html] учебник, но мне все еще не хватает чего-то ...
Scikit NaN или сообщение об ошибке бесконечности
Я импортирую некоторые данные из CSV-файла. Файл имеет значения nan, помеченные текстом «NA». Я импортирую данные с: X = genfromtxt(data, delimiter=',', dtype=float, skip_header=1)Я использую этот код для замены nan на ранее вычисленное среднее ...
Коэффициент загрузки с использованием sklearn
Я хочу корреляции между отдельными переменными и основными компонентами в Python. Я использую PCA в sklearn. Я не понимаю, как я могу получить матрицу загрузки после того, как я разложил свои данные? Мой код здесь. iris = load_iris() data, y = ...
перекрестная проверка scikit-learn, отрицательные значения со среднеквадратичной ошибкой
Когда я использую следующий код с матрицей данныхX размера (952,144) и выходного вектораy размером (952),mean_squared_error метрика возвращает отрицательные значения, что является неожиданным. Есть ли у вас какие-либо идеи? from sklearn.svm ...
Объединение пользовательских функций с CountVectorizer
У меня есть куча файлов со статьями. Для каждой статьи должно быть несколько функций, таких как:длина текста, text_spam(все являются целыми числами или числами с плавающей запятой, и в большинстве случаев они должны быть загружены из CSV). И я ...
Как использовать нецелочисленные строковые метки с SVM из scikit-learn? питон
Scikit-learn имеет довольно удобные модули Python для машинного обучения. Я пытаюсь обучить SVM-тегер для обработки естественного языка (NLP), где мои метки и входные данные - это слова и аннотации. Например. Тегирование части речи вместо ...
scikit-learn: использование sample_weight в grid_search
Можно ли выполнить grid_search (чтобы получить лучший SVM C) и все же указать sample_weight с помощью scikit-learn? Вот ошибка, с которой я столкнулся: gs = GridSearchCV (svm.SVC (C = 1), [{'kernel': ['linear'], 'C': [.1, 1, 10], 'вероятность': ...
Многопроцессорная Scikit-Learn
Я получил linearsvc, работающий против тренировочного набора и тестового набора, используяload_file Метод, который я пытаюсь заставить его работать на многопроцессорной среде. Как я могу получить многопроцессорную работу ...
Как я могу получить наиболее частые термины из векторов TD-idf для каждого файла в scikit-learn?
Я пытаюсь получить термины с наивысшей частотой из векторов в scikit-learn. Из примера Это можно сделать, используя это для каждой категории, но я хочу это для каждого файла внутри ...