@ Темно Может быть ... но я не думаю, что это предназначено для работы с пандами.

Question

Dec 22, 2017, 08:47 AM

@ Темно Может быть ... но я не думаю, что это предназначено для работы с пандами.

лизирую данные пандыdf1 содержащий строки строк У меня есть список ключевых слов и мне нужно удалить каждую строку вdf1 содержащий любое слово из списка литературы.

В настоящее время я делаю это так:

reference_list: ["words", "to", "remove"]
df1 = df1[~df1[0].str.contains(r"words")]
df1 = df1[~df1[0].str.contains(r"to")]
df1 = df1[~df1[0].str.contains(r"remove")]

Который не масштабируется до тысяч слов. Тем не менее, когда я делаю:

df1 = df1[~df1[0].str.contains(reference_word for reference_word in reference_list)]

Я выдаю ошибкупервый аргумент должен быть строкой или скомпилированным шаблоном.

Следующийэто Решение, я попробовал:

reference_list: "words|to|remove" 
df1 = df1[~df1[0].str.contains(reference_list)]

Что не вызывает исключения, но не разбирает все слова.

Как эффективно использовать str.contains со списком слов?

@ Темно Может быть ... но я не думаю, что это предназначено для работы с пандами.

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

@ Темно Может быть ... но я не думаю, что это предназначено для работы с пандами.

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы