Python-Regex: Entfernen Sie alle Satzzeichen mit Ausnahme des Bindestrichs für die Unicode-Zeichenfolge
Ich habe diesen Code zum Entfernen jeglicher Interpunktion aus einer regulären Zeichenfolge:
import regex as re
re.sub(ur"\p{P}+", "", txt)
Wie würde ich es ändern, um Bindestriche zuzulassen? Wenn Sie erklären könnten, wie Sie es gemacht haben, wäre das großartig. Ich verstehe das hier, korrigiere mich, wenn ich falsch liege, P mit irgendetwas, nachdem es Interpunktion ist.