Producto cartesiano de un marco de datos de pandas consigo mismo
Dado un marco de datos:
id value
0 1 a
1 2 b
2 3 c
Quiero obtener un nuevo marco de datos que sea básicamente el producto cartesiano de cada fila entre sí.excluyéndose:
id value id_2 value_2
0 1 a 2 b
1 1 a 3 c
2 2 b 1 a
3 2 b 3 c
4 3 c 1 a
5 3 c 2 b
Este es mi enfoque a partir de ahora. Uso itertools para obtener el producto y luego usopd.concat
condf.loc
para obtener el nuevo marco de datos.
from itertools import product
ids = df.index.values
ids_1, ids_2 = list(zip(*filter(lambda x: x[0] != x[1], product(ids, ids))))
df_new = pd.concat([df.loc[ids_1, :].reset_index(), df.loc[ids_2, :].reset_index()], 1).drop('index', 1)
df_new
id value id value
0 1 a 2 b
1 1 a 3 c
2 2 b 1 a
3 2 b 3 c
4 3 c 1 a
5 3 c 2 b
¿Hay alguna forma más simple?