Это приводит к 44 различным комбинациям столбцов.
я есть файл CSV (не нормализованный, например, реальный файл до 100 столбцов):
ID, CUST_NAME, CLIENT_NAME, PAYMENT_NUM, START_DATE, END_DATE
1, CUST1, CLIENT1, 10, 2018-04-01, 2018-04-02
2, CUST1, CLIENT1, 10, 2018-04-01, 2018-05-30
3, CUST1, CLIENT1, 101, 2018-04-02, 2018-04-03
4, CUST2, CLIENT1, 102, 2018-04-02, 2018-04-03
Как я могу найти все возможные наборы столбцов, которые могут быть использованы в качестве первичного ключа.
Желаемый вывод:
1) ID
2) PAYMENT_NUM,START_DATE,END_DATE
3) CUST_NAME, CLIENT_NAME, PAYMENT_NUM,START_DATE,END_DATE
Я мог бы сделать это на Java, но, возможно, Python / Pandas уже предоставляет быстрое решение