Панды: изменение данных
У меня есть серия панд, которая в настоящее время выглядит следующим образом:
14 [Yellow, Pizza, Restaurants]
...
160920 [Automotive, Auto Parts & Supplies]
160921 [Lighting Fixtures & Equipment, Home Services]
160922 [Food, Pizza, Candy Stores]
160923 [Hair Removal, Nail Salons, Beauty & Spas]
160924 [Hair Removal, Nail Salons, Beauty & Spas]
И я хочу радикально преобразовать его в массив данных, который выглядит примерно так ...
Yellow Automotive Pizza
14 1 0 1
…
160920 0 1 0
160921 0 0 0
160922 0 0 1
160923 0 0 0
160924 0 0 0
то есть. логическая конструкция, отмечающая, к каким категориям относится каждое наблюдение (строка).
Я способен писать для кода, основанного на циклах, чтобы решить проблему, но учитывая большое количество строк, которые мне нужно обработать, это будет очень медленно.
Кто-нибудь знает векторизованное решение этой проблемы? Я был бы очень благодарен.
РЕДАКТИРОВАТЬ: есть 509 категорий, которые у меня есть список.