более идиоматичный и должен быть быстрее по сравнению с
я есть два кадра данных, которые оба имеютOrder ID
иdate
.
Я хотел добавить флаг в первый фрейм данныхdf1
: если запись с таким жеorder id
а такжеdate
находится в кадре данныхdf2
затем добавьтеY
:
[ df1['R'] = np.where(orders['key'].isin(df2['key']), 'Y', 0)]
Для этого я собирался создать ключ, который был быorder_id
а такжеdate
, но когда я пытаюсь следующий код:
df1['key']=df1['Order_ID']+'_'+df1['Date']
Я получаю эту ошибку
ufunc 'add' did not contain a loop with signature matching types dtype('S21') dtype('S21') dtype('S21')
df1 выглядит так:
Date | Order_ID | other data points ...
201751 4395674 ...
201762 3487535 ...
Это типы данных:
df1.info()
RangeIndex: 157443 entries, 0 to 157442
Data columns (total 6 columns):
Order_ID 157429 non-null object
Date 157443 non-null int64
...
dtypes: float64(2), int64(2), object(2)
memory usage: 7.2+ MB
df1['Order_ID'].values
array(['782833030', '782834969', '782836416', ..., '783678018',
'783679806', '783679874'], dtype=object)