Produto cartesiano de um dataframe de pandas consigo mesmo
Dado um quadro de dados:
id value
0 1 a
1 2 b
2 3 c
Quero obter um novo quadro de dados que seja basicamente o produto cartesiano de cada linha entre si.excluindo-se:
id value id_2 value_2
0 1 a 2 b
1 1 a 3 c
2 2 b 1 a
3 2 b 3 c
4 3 c 1 a
5 3 c 2 b
Esta é a minha abordagem a partir de agora. Eu uso ferramentas para obter o produto e depois usopd.concat
comdf.loc
para obter o novo quadro de dados.
from itertools import product
ids = df.index.values
ids_1, ids_2 = list(zip(*filter(lambda x: x[0] != x[1], product(ids, ids))))
df_new = pd.concat([df.loc[ids_1, :].reset_index(), df.loc[ids_2, :].reset_index()], 1).drop('index', 1)
df_new
id value id value
0 1 a 2 b
1 1 a 3 c
2 2 b 1 a
3 2 b 3 c
4 3 c 1 a
5 3 c 2 b
Existe uma maneira mais simples?