на вопрос).
ел бы создать функцию вPYSPARK которые получают Dataframe и список параметров (коды / категориальные функции) и возвращают фрейм данных с дополнительными фиктивными столбцами, такими как категории объектов в списке PFA до и после DF:До и после фрейма данных - пример
Код на python выглядит так:
enum = ['column1','column2']
for e in enum:
print e
temp = pd.get_dummies(data[e],drop_first=True,prefix=e)
data = pd.concat([data,temp], axis=1)
data.drop(e,axis=1,inplace=True)
data.to_csv('enum_data.csv')