Результаты поиска по запросу "scikit-learn"

2 ответа

Сколько функций может научить Scikit-Learn?

У меня есть CSV-файл размером [66k, 56k] (строки, столбцы). Это редкая матрица. Я знаю, что NumPy может справиться с этим размером матрицы. Я хотел бы знать, исходя из опыта каждого, сколько функций алгоритмы scikit-learn могут обрабатывать с ...

2 ответа

Как я могу уменьшить использование памяти Scikit-Learn Vectorizer?

TFIDFVectorizer занимает столько памяти, что для векторизации 470 МБ документов объемом 100 КБ требуется более 6 ГБ, если мы отправим 21 миллион документов, это не поместится в 60 ГБ оперативной памяти, которая у нас есть. Итак, мы идем на ...

2 ответа

Почему одно горячее кодирование улучшает производительность машинного обучения?

Я заметил, что когда кодирование One Hot используется в конкретном наборе данных (матрице) и используется в качестве обучающих данных для алгоритмов обучения, это дает значительно лучшие результаты в отношении точности прогнозирования ...

ТОП публикаций

1 ответ

Как узнать, какие классы представлены в массиве return из предиката_proba в Scikit-learn

Я начинаю с Scikit-учиться ... >>> import sklearn >>> sklearn.__version__ '0.13.1' >>> from sklearn import svm >>> model = svm.SVC(probability=True) >>> X = [[1,2,3], [2,3,4]] # feature vectors >>> Y = ['apple', 'orange'] # classes >>> ...

1 ответ

Как найти Точность, Напомним, Точность, используя SVM?

Дубликат расчета точности, отзыва и F балла [https://stackoverflow.com/questions/16927964/how-to-calculate-precision-recall-and-f-score-with-libsvm-in-python/16964420#16964420] У меня есть входной файл с текстовым описанием и классифицированным ...

2 ответа

Запуск в ImportError с помощью sklearn при обучении

Привет! Я пытаюсь следовать учебнику по машинному обучению 101, предоставленному sklearn, и продолжаю сталкиваться с ошибкой. У меня самая склеарн-версия, скачанная ...

3 ответа

Как преобразовать подмножество столбцов И строк в панде DataFrame в массивный массив?

Мне интересно, существует ли более простой и эффективный способ выбора подмножества строк и столбцов в панде DataFrame. Например, учитывая этот кадр данных: df = DataFrame(np.random.rand(4,5), columns = list('abcde')) print df a b c d e 0 ...

2 ответа

Панды: использовать несколько столбцов данных в качестве индекса другого

1 ответ

Scikit learn - fit_transform на тестовом наборе

Я изо всех сил пытаюсь использовать Random Forest в Python с Scikit Learn. Моя проблема в том, что я использую его для классификации текста (в 3 классах - по...

2 ответа

OLS регрессия: Scikit против Statsmodels?

Укороченная версия: Я использовал scikit LinearRegression на некоторых данных, но я привык к p-значениям, поэтому помещаю данные в OLS statsmodels, и хотя R ...