Python Pandas удаляет подстроку, используя другой столбец

Question

Jan 13, 2016, 06:35 PM

Python Pandas удаляет подстроку, используя другой столбец

Я пробовал искать и не могу найти простой способ сделать это, поэтому я надеюсь, что ваш опыт может помочь.

У меня есть фрейм данных панд с двумя столбцами

import numpy as np
import pandas as pd

pd.options.display.width = 1000
testing = pd.DataFrame({'NAME':[
    'FIRST', np.nan, 'NAME2', 'NAME3', 
    'NAME4', 'NAME5', 'NAME6'], 'FULL_NAME':['FIRST LAST', np.nan, 'FIRST LAST', 'FIRST NAME3', 'FIRST NAME4 LAST', 'ANOTHER NAME', 'LAST NAME']})

что дает мне

          FULL_NAME   NAME
0        FIRST LAST  FIRST
1               NaN    NaN
2        FIRST LAST  NAME2
3       FIRST NAME3  NAME3
4  FIRST NAME4 LAST  NAME4
5      ANOTHER NAME  NAME5
6         LAST NAME  NAME6

я хотел бы взять значения из столбца «ИМЯ» и затем удалить их из столбца «ФИО», если он там есть. Таким образом, функция будет затем возвращать

          FULL_NAME   NAME           NEW
0        FIRST LAST  FIRST          LAST
1               NaN    NaN           NaN
2        FIRST LAST  NAME2    FIRST LAST
3       FIRST NAME3  NAME3         FIRST
4  FIRST NAME4 LAST  NAME4    FIRST LAST
5      ANOTHER NAME  NAME5  ANOTHER NAME
6         LAST NAME  NAME6     LAST NAME

Пока что я определил функцию ниже и использую метод apply. Это работает довольно медленно на моем большом наборе данных, и я надеюсь, что есть более эффективный способ сделать это. Спасибо!

def address_remove(x):
    try:
        newADDR1 = re.sub(x['NAME'], '', x[-1])
        newADDR1 = newADDR1.rstrip()
        newADDR1 = newADDR1.lstrip()
        return newADDR1
    except:
        return x[-1]

Python Pandas удаляет подстроку, используя другой столбец

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Python Pandas удаляет подстроку, используя другой столбец

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы