@ Темно Может быть ... но я не думаю, что это предназначено для работы с пандами.
лизирую данные пандыdf1
содержащий строки строк У меня есть список ключевых слов и мне нужно удалить каждую строку вdf1
содержащий любое слово из списка литературы.
В настоящее время я делаю это так:
reference_list: ["words", "to", "remove"]
df1 = df1[~df1[0].str.contains(r"words")]
df1 = df1[~df1[0].str.contains(r"to")]
df1 = df1[~df1[0].str.contains(r"remove")]
Который не масштабируется до тысяч слов. Тем не менее, когда я делаю:
df1 = df1[~df1[0].str.contains(reference_word for reference_word in reference_list)]
Я выдаю ошибкупервый аргумент должен быть строкой или скомпилированным шаблоном.
Следующийэто Решение, я попробовал:
reference_list: "words|to|remove"
df1 = df1[~df1[0].str.contains(reference_list)]
Что не вызывает исключения, но не разбирает все слова.
Как эффективно использовать str.contains со списком слов?