Wie durchlaufe ich eine Pandas-Gruppe und überprüfe, ob sich in jeder Gruppe eine Zeichenfolge befindet?
Ich habe einen Pandas-Datenrahmen mit einer Reihe von Datensätzen an bestimmten Daten. Ich muss sie nach Datum gruppieren und überprüfen, ob am nächsten Tag Datensätze vorhanden sind, die sich auch am Vortag befinden. Insbesondere muss ich ausgeben, welche Datensätze gelöscht wurden.
Hier ist ein Beispieldatensatz:
Date Item
20160101 apple
20160101 pear
20160101 banana
20160102 apple
20160102 pear
20160102 beans
Ich muss die Unterschiede herausfinden, die für jedes Datum auftreten. In diesem Beispiel wurde ab dem 01.02.2016 eine Zeichenfolge "Bohnen" hinzugefügt und eine "Banane" aus der Gruppe entfernt.
So weit ich als mein Code habe:
groups = frame['Item'].groupby(frame['Date'])
for date, item in groups:
for i in item:
if i not in item[:-1]:
print date, item, 'Deleted'
Dies scheint nicht zu funktionieren. Ich sollte erwarten:
20160102 , banana, Deleted
Danke für Ihre Hilfe