Результаты поиска по запросу "scikit-learn"
Мне также интересно, если мой подход сам по себе полностью неверен
мой код. Я знаю, почему ошибка происходит во время преобразования. Это из-за несоответствия списка возможностей во время подгонки и преобразования. Как я могу решить это? Как я могу получить 0 для всех остальных функций? После этого я хочу ...
в этом случае не будет произведена ни начальная выборка, ни случайный выбор объектов, и производительность должна быть примерно равна производительности одного дерева решений.
чаю машинное обучение сscikit-learn библиотека. Я применяю классификатор дерева решений и классификатор случайных лесов к своим данным с помощью этого кода: def decision_tree(train_X, train_Y, test_X, test_Y): clf = tree.DecisionTreeClassifier() ...
@ Темно, это правда. Единственная причина, по которой вы выбрали бы это решение вместо факторизации, заключается в том, что вы намереваетесь использовать категориальные функции (например, валидацию), а представление кода - это просто альтернативное представление.
отрим следующий кадр данных: import pandas as pd from sklearn.preprocessing import LabelEncoder df = pd.DataFrame(data=[["France", "Italy", "Belgium"], ["Italy", "France", "Belgium"]], columns=["a", "b", "c"]) df ...
, В результате ваш конвейер должен быть:
аюсь создать конвейер sklearn в 2 этапа: Стандартизировать данныеПодгонка данных с использованием KNNТем не менее, мои данные имеют как числовые, так и категориальные переменные, которые я конвертировал в пустышки, используяpd.get_dummies, Я ...
Как мне узнать, на какие атрибуты распадается мое дерево при использовании scikit-learn?
Я изучал scikit-learn, создавал деревья решений по критериям энтропии и расщепления Джини, а также изучал различия. Мой вопрос: как я могу «открыть капот» и выяснить, на какие именно атрибуты делятся деревья на каждом уровне, а также на ...
Да, может, но LOO разделит данные на 11: 1 двенадцать раз. Синтаксис для цикла немного отличается. У стратифицированного KFold есть y в split (). Не могли бы вы проверить, как вы готовите свои данные. Будет хорошо иметь df с данными из X и столбец с метками A / B последними. Итак, если у вас есть шесть столбцов с независимыми данными, седьмой столбец должен иметь метки в качестве зависимой переменной. Затем вы можете разделить их так, как это делается в примере выше.
я есть следующие данные, где для каждого столбца строки с номерами являются входными данными, а буква - выходными ...
Благодарю. Я бы предпочел что-то более прямое, но если бы ничего не существовало, это могло бы сработать.
вая следующий пример: from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.decomposition import NMF from sklearn.pipeline import Pipeline import pandas as pd pipe = Pipeline([ ("tf_idf", TfidfVectorizer()), ("nmf", NMF()) ...
Спасибо за ваш ответ Макс, я приму ответ Vivek, так как я нашел его немного более полезным, но ваш ответ действительно помогает мне.
тоящее время я работаю над проблемой, которая сравнивает три разных алгоритма машинного обучения на одном наборе данных. Я разделил набор данных на 70/30 обучающих / тестовых наборов, а затем выполнил поиск по сетке для лучших параметров каждого ...
) и для предотвращения дисбаланса классов (добавьте одинаковое количество каждого класса в партии). Нравится:
нирую 3 списка данных L1, L2, L3. Сначала я обучаю их всех с помощью SGDClassifier fit (), а затем - экземпляром за экземпляром с part_fit (). Я проверяю данные с помощью L4, L5. [Данные в списках являются данными изображения, а изображения L4, ...