fusionar dos marcos de datos sin repeticiones de pandas
Estoy tratando de fusionar dos marcos de datos, uno con columnas: customerId, nombre completo y correos electrónicos y el otro marco de datos con columnas: customerId, cantidad y fecha. Quiero que el primer marco de datos sea el marco de datos principal y que se incluya la otra información del marco de datos, pero solo si los ID de cliente coinciden; Traté de hacer:
merge = pd.merge(df, df2, on='customerId', how='left')
pero el marco de datos que se produce contiene muchas repeticiones y se ve mal:
customerId full name emails amount date
0 002963338 Star shine star.shine@cdw.com $2,910.94 2016-06-14
1 002963338 Star shine star.shine@cdw.com $9,067.70 2016-05-27
2 002963338 Star shine star.shine@cdw.com $6,507.24 2016-04-12
3 002963338 Star shine star.shine@cdw.com $1,457.99 2016-02-24
4 986423367 palm tree tree.palm@snapchat.com,tree@.com $4,604.83 2016-07-16
esto no puede ser correcto, por favor ayuda!