Перестройка структуры многих текстовых файлов и затем объединение их в один фрейм данных

Я был бы очень признателен за вашу помощь в этом!

У меня есть ~ 4,5 тыс. Текстовых файлов, которые выглядят так:

Simple statistics using MSPA parameters: 8_3_1_1 on input file: 20130815 104359  875  000000 0528 0548_result.tif

 MSPA-class [color]:  Foreground/data pixels [%]  Frequency
============================================================
    CORE(s) [green]:               --                   0
    CORE(m) [green]:      48.43/13.45                   1
    CORE(l) [green]:               --                   0
      ISLET [brown]:       3.70/ 1.03                  20
 PERFORATION [blue]:       0.00/ 0.00                   0
       EDGE [black]:      30.93/ 8.59                  11
      LOOP [yellow]:       9.66/ 2.68                   6
       BRIDGE [red]:       0.00/ 0.00                   0
    BRANCH [orange]:       7.28/ 2.02                  40
  Background [grey]:       --- /72.22                  11
    Missing [white]:            0.00                    0

Я хочу прочитать все текстовые файлы из каталога в R, а затем выполнить задачу по их переупорядочению, прежде чем объединить их вместе.

Значения в текстовых файлах могут изменяться, поэтому в тех местах, где сейчас 0,00, в некоторых файлах может быть релевантное число (поэтому они нам нужны). Для полей, где есть - сейчас, было бы хорошо, если бы скрипт мог проверить, есть ли - или число. Если есть -, это должно превратить их в НС. С другой стороны, реальные значения 0,00 имеют значение, и они мне нужны. Существует только одно значение для пропущенного белого столбца (или строки здесь), которое затем следует скопировать в оба столбца, передний план% и пиксели данных%.

Общая перестановка, которая мне нужна, состоит в том, чтобы сделать все данные доступными в виде столбцов только с 1 строкой на текстовый файл. Для каждой строки данных в текстовом файле здесь должно быть 3 столбца в выходном файле (передний план%, пиксель% данных и частота для каждого цвета). Название строки должно быть именем изображения, которое упоминается в начале файла, здесь: 20130815 104359 875 000000 0528 0548

Остальное можно опустить.

Вывод должен выглядеть примерно так:

Я работаю над этим одновременно, но не уверен, какое направление выбрать. Поэтому любая помощь приветствуется!

Бест, Мориц

Ответы на вопрос(2)

Ваш ответ на вопрос