Extrahieren Sie inkonsistent formatiertes Datum aus der Zeichenfolge (Datumsanalyse, NLP)

Ich habe eine große Liste von Dateien, von denen einige Datumsangaben im Dateinamen enthalten. Das Format der Daten ist inkonsistent und oft unvollständig, z. "Aug06", "Aug2006", "August 2006", "08-06", "01-08-06", "2006", "011004" usw. Außerdem haben einige Dateinamen nicht verwandte Nummern, die in etwa so aussehen termine, zb "20202010".

urz gesagt, die Daten sind normalerweise unvollständig, manchmal nicht vorhanden, sind inkonsistent formatiert und in eine Zeichenfolge mit anderen Informationen eingebettet, z. "Report Aug06.xls".

Gibt es irgendwelche Perl-Module, die das Datum eines solchen Strings richtig erraten können? Es muss nicht zu 100% korrekt sein, da es manuell von einem Menschen überprüft wird, aber ich versuche, die Dinge für diese Person so einfach wie möglich zu gestalten, und es gibt Tausende von Einträgen, die überprüft werden müssen:)

Antworten auf die Frage(6)

Ihre Antwort auf die Frage