@ Темно, это правда. Единственная причина, по которой вы выбрали бы это решение вместо факторизации, заключается в том, что вы намереваетесь использовать категориальные функции (например, валидацию), а представление кода - это просто альтернативное представление.

Question

Feb 04, 2018, 10:57 PM

@ Темно, это правда. Единственная причина, по которой вы выбрали бы это решение вместо факторизации, заключается в том, что вы намереваетесь использовать категориальные функции (например, валидацию), а представление кода - это просто альтернативное представление.

отрим следующий кадр данных:

import pandas as pd
from sklearn.preprocessing import LabelEncoder

df = pd.DataFrame(data=[["France", "Italy", "Belgium"], ["Italy", "France", "Belgium"]], columns=["a", "b", "c"])
df = df.apply(LabelEncoder().fit_transform)
print(df)

В настоящее время выводит:

   a  b  c
0  0  1  0
1  1  0  0

Моя цель - заставить его выводить что-то вроде этого, передавая столбцы, которые я хочу разделить категориальными значениями:

   a  b  c
0  0  1  2
1  1  0  2

Ответы на вопрос(4)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Ответы на вопрос(4)

Ваш ответ на вопрос

Популярные вопросы