Результаты поиска по запросу "scikit-learn"

мой код. Я знаю, почему ошибка происходит во время преобразования. Это из-за несоответствия списка возможностей во время подгонки и преобразования. Как я могу решить это? Как я могу получить 0 для всех остальных функций? После этого я хочу ...

machine-learning decision-tree random-forest

1 ответ

в этом случае не будет произведена ни начальная выборка, ни случайный выбор объектов, и производительность должна быть примерно равна производительности одного дерева решений.

чаю машинное обучение сscikit-learn библиотека. Я применяю классификатор дерева решений и классификатор случайных лесов к своим данным с помощью этого кода: def decision_tree(train_X, train_Y, test_X, test_Y): clf = tree.DecisionTreeClassifier() ...

python pandas

4 ответа

@ Темно, это правда. Единственная причина, по которой вы выбрали бы это решение вместо факторизации, заключается в том, что вы намереваетесь использовать категориальные функции (например, валидацию), а представление кода - это просто альтернативное представление.

отрим следующий кадр данных: import pandas as pd from sklearn.preprocessing import LabelEncoder df = pd.DataFrame(data=[["France", "Italy", "Belgium"], ["Italy", "France", "Belgium"]], columns=["a", "b", "c"]) df ...

ТОП публикаций

How to write controller in Odoo 12

EHR Software Development: What you need to know [SPDLoad Full Guide]

Любимый шрифт свинки Пеппы и как его сделать

10 Food Delivery Startups to Watch for in 2020

python

3 ответа

, В результате ваш конвейер должен быть:

аюсь создать конвейер sklearn в 2 этапа: Стандартизировать данныеПодгонка данных с использованием KNNТем не менее, мои данные имеют как числовые, так и категориальные переменные, которые я конвертировал в пустышки, используяpd.get_dummies, Я ...

python machine-learning decision-tree

2 ответа

Как мне узнать, на какие атрибуты распадается мое дерево при использовании scikit-learn?

Я изучал scikit-learn, создавал деревья решений по критериям энтропии и расщепления Джини, а также изучал различия. Мой вопрос: как я могу «открыть капот» и выяснить, на какие именно атрибуты делятся деревья на каждом уровне, а также на ...

pandas python machine-learning cross-validation

1 ответ

Да, может, но LOO разделит данные на 11: 1 двенадцать раз. Синтаксис для цикла немного отличается. У стратифицированного KFold есть y в split (). Не могли бы вы проверить, как вы готовите свои данные. Будет хорошо иметь df с данными из X и столбец с метками A / B последними. Итак, если у вас есть шесть столбцов с независимыми данными, седьмой столбец должен иметь метки в качестве зависимой переменной. Затем вы можете разделить их так, как это делается в примере выше.

я есть следующие данные, где для каждого столбца строки с номерами являются входными данными, а буква - выходными ...

python

1 ответ

Благодарю. Я бы предпочел что-то более прямое, но если бы ничего не существовало, это могло бы сработать.

вая следующий пример: from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.decomposition import NMF from sklearn.pipeline import Pipeline import pandas as pd pipe = Pipeline([ ("tf_idf", TfidfVectorizer()), ("nmf", NMF()) ...

grid-search python cross-validation machine-learning

2 ответа

Спасибо за ваш ответ Макс, я приму ответ Vivek, так как я нашел его немного более полезным, но ваш ответ действительно помогает мне.

тоящее время я работаю над проблемой, которая сравнивает три разных алгоритма машинного обучения на одном наборе данных. Я разделил набор данных на 70/30 обучающих / тестовых наборов, а затем выполнил поиск по сетке для лучших параметров каждого ...

machine-learning python data-science

1 ответ

) и для предотвращения дисбаланса классов (добавьте одинаковое количество каждого класса в партии). Нравится:

нирую 3 списка данных L1, L2, L3. Сначала я обучаю их всех с помощью SGDClassifier fit (), а затем - экземпляром за экземпляром с part_fit (). Я проверяю данные с помощью L4, L5. [Данные в списках являются данными изображения, а изображения L4, ...

pandas csv python tf-idf

1 ответ

стоимость.

аюсь выполнить аналогичную операцию, как показаноВот [https://stackoverflow.com/questions/39303912/tfidfvectorizer-in-scikit-learn-valueerror-np-nan-is-an-invalid-document] , Я начинаю с чтения в двух столбцах из файла CSV, который содержит 2405 ...

Страница 41 из 48

39 404142 43

Результаты поиска по запросу "scikit-learn"

Мне также интересно, если мой подход сам по себе полностью неверен

Популярные теги

ТОП публикаций

, В результате ваш конвейер должен быть:

Как мне узнать, на какие атрибуты распадается мое дерево при использовании scikit-learn?

Благодарю. Я бы предпочел что-то более прямое, но если бы ничего не существовало, это могло бы сработать.

Спасибо за ваш ответ Макс, я приму ответ Vivek, так как я нашел его немного более полезным, но ваш ответ действительно помогает мне.

) и для предотвращения дисбаланса классов (добавьте одинаковое количество каждого класса в партии). Нравится:

стоимость.

Вы очень активны! Это здорово!

Результаты поиска по запросу "scikit-learn"

Популярные теги

ТОП публикаций