Перестройка структуры многих текстовых файлов и затем объединение их в один фрейм данных
Я был бы очень признателен за вашу помощь в этом!
У меня есть ~ 4,5 тыс. Текстовых файлов, которые выглядят так:
Simple statistics using MSPA parameters: 8_3_1_1 on input file: 20130815 104359 875 000000 0528 0548_result.tif
MSPA-class [color]: Foreground/data pixels [%] Frequency
============================================================
CORE(s) [green]: -- 0
CORE(m) [green]: 48.43/13.45 1
CORE(l) [green]: -- 0
ISLET [brown]: 3.70/ 1.03 20
PERFORATION [blue]: 0.00/ 0.00 0
EDGE [black]: 30.93/ 8.59 11
LOOP [yellow]: 9.66/ 2.68 6
BRIDGE [red]: 0.00/ 0.00 0
BRANCH [orange]: 7.28/ 2.02 40
Background [grey]: --- /72.22 11
Missing [white]: 0.00 0
Я хочу прочитать все текстовые файлы из каталога в R, а затем выполнить задачу по их переупорядочению, прежде чем объединить их вместе.
Значения в текстовых файлах могут изменяться, поэтому в тех местах, где сейчас 0,00, в некоторых файлах может быть релевантное число (поэтому они нам нужны). Для полей, где есть - сейчас, было бы хорошо, если бы скрипт мог проверить, есть ли - или число. Если есть -, это должно превратить их в НС. С другой стороны, реальные значения 0,00 имеют значение, и они мне нужны. Существует только одно значение для пропущенного белого столбца (или строки здесь), которое затем следует скопировать в оба столбца, передний план% и пиксели данных%.
Общая перестановка, которая мне нужна, состоит в том, чтобы сделать все данные доступными в виде столбцов только с 1 строкой на текстовый файл. Для каждой строки данных в текстовом файле здесь должно быть 3 столбца в выходном файле (передний план%, пиксель% данных и частота для каждого цвета). Название строки должно быть именем изображения, которое упоминается в начале файла, здесь: 20130815 104359 875 000000 0528 0548
Остальное можно опустить.
Вывод должен выглядеть примерно так:
Я работаю над этим одновременно, но не уверен, какое направление выбрать. Поэтому любая помощь приветствуется!
Бест, Мориц