Результаты поиска по запросу "scikit-learn"

3 ответа

Коэффициент загрузки с использованием sklearn

Я хочу корреляции между отдельными переменными и основными компонентами в Python. Я использую PCA в sklearn. Я не понимаю, как я могу получить матрицу загрузки после того, как я разложил свои данные? Мой код здесь. iris = load_iris() data, y = ...

1 ответ

Как получить вес функций

Я имею дело с сильно несбалансированным набором данных, и моя идея состоит в том, чтобы получить значения весов функций из моегоlibSVM модель. На данный момент я в порядке с линейным ядром, где я могу получить весовые характеристики, но когда я ...

2 ответа

Scikit NaN или сообщение об ошибке бесконечности

Я импортирую некоторые данные из CSV-файла. Файл имеет значения nan, помеченные текстом «NA». Я импортирую данные с: X = genfromtxt(data, delimiter=',', dtype=float, skip_header=1)Я использую этот код для замены nan на ранее вычисленное среднее ...

ТОП публикаций

2 ответа

Как исправить частоту ложных срабатываний линейного SVM?

Я новичок в SVM, и это мой пример использования: у меня много несбалансированных данных, которые должны быть двоично классифицированы с использованием линейного SVM. Мне нужно зафиксировать уровень ложных срабатываний при определенных значениях и ...

1 ответ

перекрестная проверка scikit-learn, отрицательные значения со среднеквадратичной ошибкой

Когда я использую следующий код с матрицей данныхX размера (952,144) и выходного вектораy размером (952),mean_squared_error метрика возвращает отрицательные значения, что является неожиданным. Есть ли у вас какие-либо идеи? from sklearn.svm ...

3 ответа

Предсказание, сколько времени займет классификация по науке

Есть ли способ предсказать, сколько времени потребуется для запуска классификатора из обучения sci-kit на основе параметров и набора данных? Я знаю, довольно мета, верно? Некоторые комбинации классификаторов и параметров довольно быстрые, а ...

1 ответ

Объединение пользовательских функций с CountVectorizer

У меня есть куча файлов со статьями. Для каждой статьи должно быть несколько функций, таких как:длина текста, text_spam(все являются целыми числами или числами с плавающей запятой, и в большинстве случаев они должны быть загружены из CSV). И я ...

2 ответа

Используете тот же самый Label Encoder для тестирования набора данных? или новый кодировщик этикеток?

Я новичок в изучении scikit-learn. Я хочу знать, должен ли я использовать тот же экземпляр Label Encoder, который использовался в наборе обучающих данных, или нет, когда я хочу преобразовать категориальные данные той же функции в тестовом ...

1 ответ

Scikit-Learn подходит для задач с большими данными?

Я работаю над задачей TREC, включающей использование методов машинного обучения, где набор данных состоит из более чем 5 терабайт веб-документов, из которых планируется извлечь векторы из набора слов.scikit-learn @ есть хороший набор функций, ...