Wyodrębnij kolumny z pliku na podstawie nagłówka wybranego z innego pliku
Mam następujący problem, który chcę rozwiązać w awk. Mam jedną dużą tabelę tekstową, oddzieloną przecinkami, składającą się z 100k wierszy i 5k colów. Pierwszy wiersz to nagłówek, a pierwsza kolumna to identyfikator rekordu. Następnie mam drugi plik tekstowy zawierający podzbiór nagłówków w pierwszym pliku. Chcę wyodrębnić wszystkie kolumny pierwszego pliku, którego nagłówek znajduje się na liście podanej w drugim pliku. Oto przykład wejść i pożądanego wyjścia:
DATA.TXT
ID, head1, head2, head3, head4
1, 25.5, 1364.0, 22.5, 13.2
2, 10.1, 215.56, 1.15, 22.2
LIST.TXT
head1
head4
Pożądane wyjście:
ID, head1, head4
1, 25.5, 13.2
2, 10.1, 22.2
Ktoś może dać mi kilka porad, jak rozwiązać ten problem w awk lub w skryptach uniksowych? Z góry dziękuję za wszelką pomoc!