Twórz manekiny z kolumny z wieloma wartościami w pandach
Szukam pythonowego sposobu na rozwiązanie następującego problemu.
Thepandas.get_dummies()
metoda jest świetna do tworzenia manekinów z kategorycznej kolumny ramki danych. Na przykład, jeśli kolumna ma wartości w['A', 'B']
, get_dummies()
tworzy 2 zmienne obojętne i przypisuje odpowiednio 0 lub 1.
Teraz muszę poradzić sobie z tą sytuacją. Pojedyncza kolumna, nazwijmy ją „etykietą”, ma takie wartości jak['A', 'B', 'C', 'D', 'A*C', 'C*D']
. get_dummies()
tworzy 6 manekinów, ale chcę tylko 4 z nich, więc rząd może mieć wiele 1s.
Czy istnieje sposób, aby poradzić sobie z tym w sposób pythoniczny? Mógłbym tylko wymyślić jakiś algorytm krok po kroku, aby go uzyskać, ale to nie obejmowałoby get_dummies (). Dzięki
Edytowane, mam nadzieję, że jest bardziej jasne!