Создание новой таблицы из большой таблицы .csv
У меня есть большой файл .csv. Я хотел бы отфильтровать этот файл в новую таблицу.
Например, у меня есть файл .csv, как показано ниже:
f1 f2 f3 f4 f5 f6 f7 f9 f10 f11
t1 1 0 1 0 1 0 0 0 0 1
t2 1 0 0 0 0 1 1 1 1 1
t3 0 0 0 0 0 0 0 0 0 0
t4 1 0 0 0 1 0 0 0 0 0
t5 0 0 0 0 0 0 0 0 0 0
t6 0 0 0 0 0 0 0 0 0 0
У меня есть стол (как указано выше)
Я хочу, чтобы у меня была новая таблица для каждой строки (это значит, что у меня будет новая таблица для всех строк. Например, новая таблица для строки t1, новая таблица для строки t2, новая таблица для строки t3 и т. Д. ). Как и в этом примере, у меня должно быть 6 новых таблиц.
Чтобы разработать новую таблицу для каждой строки, существует условие, которое необходимо выполнить. Новая таблица должна смотреть на каждое значение в каждом столбце. И если столбец имеет то же значение с другим столбцом в другой строке (который является значением 1), он должен быть сгруппирован вместе.
Как и в этом примере, новая таблица для t1 будет состоять из t1, t2, t4, потому что значение в столбце f1 имеет то же значение (равное 1) со значением в f1 для строк t2 и t4, также значение в f5 равно значению в f5 для строки t4, а значение в f11 равно значению в f11 для строки t2). Значит, это будет проверять каждый столбец. Один из выходных данных для должен быть таким:
f1 f2 f3 f4 f5 f6 f7 f9 f10 f11
t1 1 0 1 0 1 0 0 0 0 1
t2 1 0 0 0 0 1 1 1 1 1
t4 1 0 0 0 1 0 0 0 0 0
Что касается t2, строка t2 должна быть сгруппирована с t4, потому что значение в f1 в t1 и значение f1 в t4 равно. Однако t2 не должен учитывать более раннюю строку (как в этом примере, он не должен учитывать t1). Вывод должен быть таким:
f1 f2 f3 f4 f5 f6 f7 f9 f10 f11
t2 1 0 0 0 0 1 1 1 1 1
t4 1 0 0 0 1 0 0 0 0 0
Подобно другим строкам (строки t3, t4, t5 и t6), он должен смотреть на каждое значение в каждом столбце. И если столбец имеет то же значение с другим столбцом в другой строке (который является значением 1), он должен быть сгруппирован вместе.
Новая таблица (с заголовком строки и столбца) должна быть сохранена в новом файле .csv. Файл должен быть переименован с использованием его имени строки. например, что касается t1, он должен быть сохранен как t1.csv.
Это всего лишь простой пример. Предлагаемое решение здесь будет применено в другой большой таблице данных. Мне нужно прочитать файл abc.csv. Это означает, что, возможно, будет создано более 100+ новых таблиц (когда я использовал исходные данные).
пока я использовал этот код:
a.files