Wie extrahiere ich bestimmten Inhalt in einem Pandas-Datenframe mit einem regulären Ausdruck?

Question

Mar 16, 2016, 08:12 AM

Wie extrahiere ich bestimmten Inhalt in einem Pandas-Datenframe mit einem regulären Ausdruck?

Betrachten Sie den folgenden Pandas-Datenrahmen:

In [114]:

df['movie_title'].head()


Out[114]:

0     Toy Story (1995)
1     GoldenEye (1995)
2    Four Rooms (1995)
3    Get Shorty (1995)
4       Copycat (1995)
...
Name: movie_title, dtype: object

Aktualisieren Ich möchte mit einem regulären Ausdruck nur die Titel der Filme extrahieren. Verwenden wir also den folgenden regulären Ausdruck:\b([^\d\W]+)\b. Also habe ich folgendes probiert:

df_3['movie_title'] = df_3['movie_title'].str.extract('\b([^\d\W]+)\b')
df_3['movie_title']

Ich erhalte jedoch die folgenden Informationen:

0       NaN
1       NaN
2       NaN
3       NaN
4       NaN
5       NaN
6       NaN
7       NaN
8       NaN

Hast du eine Idee, wie du bestimmte Features aus Text in einem Pandas-Datenrahmen extrahieren kannst ?. Genauer gesagt, wie kann ich nur die Titel der Filme in einem völlig neuen Datenrahmen extrahieren? Beispielsweise sollte die gewünschte Ausgabe sein:

Out[114]:

0     Toy Story
1     GoldenEye
2    Four Rooms
3    Get Shorty
4       Copycat
...
Name: movie_title, dtype: object

Antworten auf die Frage(4)

Top Fragen

0 die antwort

Geben Sie einen Spaltennamen für data.frame an eine Funktion @ weite

0 die antwort

Wie kann ich den Emulator im selben Netzwerk wie meinen PC installieren?

0 die antwort

DelegatingHandler für die Antwort in WebApi

0 die antwort

React Error: Zielcontainer ist kein DOM-Element

0 die antwort

Wann initialisiere ich Variablen in JavaScript mit Null oder überhaupt nicht?

Du bist sehr aktiv! Es ist großartig!

Wie extrahiere ich bestimmten Inhalt in einem Pandas-Datenframe mit einem regulären Ausdruck?

Antworten auf die Frage(4)

Ihre Antwort auf die Frage

Top Fragen