fusionar dos marcos de datos sin repeticiones de pandas
Estoy tratando de fusionar dos marcos de datos, uno con columnas: customerId, nombre completo y correos electrónicos y el otro marco de datos con columnas: customerId, cantidad y fecha. Quiero que el primer marco de datos sea el marco de datos principal y que se incluya la otra información del marco de datos, pero solo si los ID de cliente coinciden; Traté de hacer:
merge = pd.merge(df, df2, on='customerId', how='left')
pero el marco de datos que se produce contiene muchas repeticiones y se ve mal:
customerId full name emails amount date
0 002963338 Star shine [email protected] $2,910.94 2016-06-14
1 002963338 Star shine [email protected] $9,067.70 2016-05-27
2 002963338 Star shine [email protected] $6,507.24 2016-04-12
3 002963338 Star shine [email protected] $1,457.99 2016-02-24
4 986423367 palm tree [email protected],[email protected] $4,604.83 2016-07-16
esto no puede ser correcto, por favor ayuda!