Результаты поиска по запросу "categorical-data"

2 ответа

@IbD, см. Обновление для примера.

м фрейме данных у меня есть несколько категориальных столбцов с более чем 100 различными категориями. Я хочу ранжировать категории наиболее часто. Я сохраняю первые 9 наиболее часто встречающихся категорий, а наименее часто ...

3 ответа

Нет, вы можете видеть значения корреляции для каждой категории в таблице :). Корреляция не может быть выражена одним числом для категориального признака с несколькими категориями, это будет бессмысленно, потому что категориальный признак не может быть представлен значением метрики в его определении.

я есть датафреймdf с нечисловым столбцомCatColumn. A B CatColumn 0 381.1396 7.343921 Medium 1 481.3268 6.786945 Medium 2 263.3766 7.628746 High 3 177.2400 5.225647 Medium-HighЯ хочу включитьCatColumn в корреляционном анализе с другими столбцами ...

1 ответ

Я хотел бы сделать этот сайт только ваш аккуратный ответ ~ :-)

оворится в вопросе, у меня есть фрейм данныхdf_original который довольно большой, но выглядит как: ID Count Column 2 Column 3 Column 4 RowX 1 234. 255. yes. 452 RowY 1 123. 135. no. 342 RowW 1 234. 235. yes. 645 RowJ 1 123. 115. no. 342 RowA 1 ...

ТОП публикаций

1 ответ

Затем он может быть обернут столбцом встраивания / индикатора. Кажется, это то, что вам нужно. Это был первый шаг для меня. Мне нужно обработать столбец со значениями, такими как "str: float | str: float ...".

мер, у меня есть данные в следующемcsv формат: csv col0 col1 col2 col3 1 A E|A|C 3 0 B D|F 2 2 C | 2Каждый столбец, разделенный запятой, представляет один элемент. Как правило, функция горячая (например,col0, col1, col3), но в этом случае ...

0 ответов

Вам удалось это выяснить? У меня точно такая же проблема, я хочу смоделировать каждого пользователя как среднее число вложений прошлых купленных предметов, но каждый пользователь мог приобрести разное количество предметов

ебята, я пытаюсь спроецировать многокомпонентные категориальные данные в плотное пространство, используя вложения. Вот игрушечный пример. Допустим, у меня есть четыре категории, и я хочу проецировать их в 2D-пространство. Кроме того, я получил ...

1 ответ

 является объектом np.float

уверен, что это уже самый быстрый метод или я делаю это неэффективно.Я хочу горячо закодировать определенный категориальный столбец, который имеет 27k + возм...

6 ответов

Примечание: этот метод хорош, если вы не заинтересованы в конвертации их обратно.

1 ответ

, Это даст режим каждой переменной для каждого кластера.

олняю кластерный анализ категориальных данных, поэтому использую подход k-mode.Мои данные представлены в форме опроса: как вам нравятся волосы и глаза?Респон...

4 ответа

Уменьшите количество уровней для больших категориальных переменных

Есть ли готовые к использованию библиотеки или пакеты для Python или R, чтобы уменьшить количество уровней для больших категориальных факторов?Я хочу добитьс...

3 ответа

Панды: конвертировать категории в числа