Doppelte Werte spaltenübergreifend in Pandas ersetzen

Question

Oct 07, 2016, 01:49 AM

Doppelte Werte spaltenübergreifend in Pandas ersetzen

Ich habe einen einfachen Datenrahmen als solchen:

df = [    {'col1' : 'A', 'col2': 'B', 'col3':   'C', 'col4':'0'},
          {'col1' : 'M', 'col2':   '0', 'col3': 'M', 'col4':'0'},
          {'col1' : 'B', 'col2':  'B', 'col3':  '0', 'col4':'B'},
          {'col1' : 'X', 'col2':  '0', 'col3':  'Y', 'col4':'0'}
          ]
df = pd.DataFrame(df)
df = df[['col1', 'col2', 'col3', 'col4']]
df

Was sieht so aus:

| col1 | col2 | col3 | col4 |
|------|------|------|------|
| A    | B    | C    | 0    |
| M    | 0    | M    | 0    |
| B    | B    | 0    | B    |
| X    | 0    | Y    | 0    |

Ich möchte nur wiederholte Zeichen durch das Zeichen '0' in den Zeilen ersetzen. Es läuft darauf hinaus, den ersten doppelten Wert beizubehalten, auf den wir stoßen:

| col1 | col2 | col3 | col4 |
|------|------|------|------|
| A    | B    | C    | 0    |
| M    | 0    | 0    | 0    |
| B    | 0    | 0    | 0    |
| X    | 0    | Y    | 0    |

Das scheint so einfach, aber ich stecke fest. Alle Stupser in die richtige Richtung wäre wirklich dankbar.