Результаты поиска по запросу "scikit-learn"

7 ответов

sklearn.LabelEncoder с невиданными ранее значениями

Еслиsklearn.LabelEncoder был установлен на тренировочном наборе, он может сломаться, если встретится с новыми значениями при использовании на тестовом наборе. Единственное решение, которое я мог бы предложить для этого, - сопоставить все новое в ...

2 ответа

Python Соотнесение кластера k-средних с экземпляром

Я прочитал документыВот [http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html]а также глядя наэто [http://fromdatawithlove.thegovans.us/2013/05/clustering-using-scikit-learn.html] учебник, но мне все еще не хватает чего-то ...

2 ответа

Scikit NaN или сообщение об ошибке бесконечности

Я импортирую некоторые данные из CSV-файла. Файл имеет значения nan, помеченные текстом «NA». Я импортирую данные с: X = genfromtxt(data, delimiter=',', dtype=float, skip_header=1)Я использую этот код для замены nan на ранее вычисленное среднее ...

ТОП публикаций

3 ответа

Коэффициент загрузки с использованием sklearn

Я хочу корреляции между отдельными переменными и основными компонентами в Python. Я использую PCA в sklearn. Я не понимаю, как я могу получить матрицу загрузки после того, как я разложил свои данные? Мой код здесь. iris = load_iris() data, y = ...

1 ответ

перекрестная проверка scikit-learn, отрицательные значения со среднеквадратичной ошибкой

Когда я использую следующий код с матрицей данныхX размера (952,144) и выходного вектораy размером (952),mean_squared_error метрика возвращает отрицательные значения, что является неожиданным. Есть ли у вас какие-либо идеи? from sklearn.svm ...

1 ответ

Объединение пользовательских функций с CountVectorizer

У меня есть куча файлов со статьями. Для каждой статьи должно быть несколько функций, таких как:длина текста, text_spam(все являются целыми числами или числами с плавающей запятой, и в большинстве случаев они должны быть загружены из CSV). И я ...

2 ответа

Как использовать нецелочисленные строковые метки с SVM из scikit-learn? питон

Scikit-learn имеет довольно удобные модули Python для машинного обучения. Я пытаюсь обучить SVM-тегер для обработки естественного языка (NLP), где мои метки и входные данные - это слова и аннотации. Например. Тегирование части речи вместо ...

3 ответа

scikit-learn: использование sample_weight в grid_search

Можно ли выполнить grid_search (чтобы получить лучший SVM C) и все же указать sample_weight с помощью scikit-learn? Вот ошибка, с которой я столкнулся: gs = GridSearchCV (svm.SVC (C = 1), [{'kernel': ['linear'], 'C': [.1, 1, 10], 'вероятность': ...

2 ответа

Многопроцессорная Scikit-Learn

Я получил linearsvc, работающий против тренировочного набора и тестового набора, используяload_file Метод, который я пытаюсь заставить его работать на многопроцессорной среде. Как я могу получить многопроцессорную работу ...

2 ответа

Как я могу получить наиболее частые термины из векторов TD-idf для каждого файла в scikit-learn?

Я пытаюсь получить термины с наивысшей частотой из векторов в scikit-learn. Из примера Это можно сделать, используя это для каждой категории, но я хочу это для каждого файла внутри ...