Apr 24, 2018, 11:47 AM

pandas python sql algorithm

Это приводит к 44 различным комбинациям столбцов.

я есть файл CSV (не нормализованный, например, реальный файл до 100 столбцов):

   ID, CUST_NAME, CLIENT_NAME, PAYMENT_NUM, START_DATE, END_DATE
    1,     CUST1,     CLIENT1,          10, 2018-04-01, 2018-04-02
    2,     CUST1,     CLIENT1,          10, 2018-04-01, 2018-05-30
    3,     CUST1,     CLIENT1,         101, 2018-04-02, 2018-04-03
    4,     CUST2,     CLIENT1,         102, 2018-04-02, 2018-04-03

Как я могу найти все возможные наборы столбцов, которые могут быть использованы в качестве первичного ключа.

Желаемый вывод:

  1) ID
  2) PAYMENT_NUM,START_DATE,END_DATE
  3) CUST_NAME, CLIENT_NAME, PAYMENT_NUM,START_DATE,END_DATE

Я мог бы сделать это на Java, но, возможно, Python / Pandas уже предоставляет быстрое решение

Ответы на вопрос(0)

Популярные вопросы

0 ответов

в node.js, как переслать все события модуля в другой

0 ответов

Как реализовать ListView с помощью fastscroll и indexer

0 ответов

Новичок в Android должен понимать «? Android: attr / actionBarSize»

0 ответов

Разница в производительности: условие помещено в предложение INNER JOIN vs WHERE

0 ответов

Разделение нерегулярных временных рядов на регулярные среднемесячные значения - R