Struktur vieler txt-Dateien neu ordnen und dann in einem Datenrahmen zusammenführen

Ich würde mich sehr über Ihre Hilfe freuen!

Ich habe ~ 4.5k txt-Dateien, die so aussehen:

Simple statistics using MSPA parameters: 8_3_1_1 on input file: 20130815 104359  875  000000 0528 0548_result.tif

 MSPA-class [color]:  Foreground/data pixels [%]  Frequency
============================================================
    CORE(s) [green]:               --                   0
    CORE(m) [green]:      48.43/13.45                   1
    CORE(l) [green]:               --                   0
      ISLET [brown]:       3.70/ 1.03                  20
 PERFORATION [blue]:       0.00/ 0.00                   0
       EDGE [black]:      30.93/ 8.59                  11
      LOOP [yellow]:       9.66/ 2.68                   6
       BRIDGE [red]:       0.00/ 0.00                   0
    BRANCH [orange]:       7.28/ 2.02                  40
  Background [grey]:       --- /72.22                  11
    Missing [white]:            0.00                    0

Ich möchte alle txt-Dateien aus einem Verzeichnis in R lesen und dann eine Neuanordnungsaufgabe für sie ausführen, bevor ich sie zusammenführe.

Die Werte in den txt-Dateien können sich ändern. An Stellen, an denen jetzt 0,00 angezeigt wird, kann dies in einigen Dateien eine relevante Zahl sein (daher benötigen wir diese). Für die Felder, in denen es - jetzt - gibt, wäre es gut, wenn das Skript prüfen könnte, ob es - oder eine Zahl gibt. Wenn es das - gibt, sollte es sie in NAs verwandeln. Andererseits sind echte 0,00-Werte von Wert und ich brauche sie. Es gibt nur einen Wert für die fehlende weiße Spalte (oder Zeile hier). Dieser Wert sollte dann in beide Spalten kopiert werden, Vordergrund% und Datenpixel%.

Die allgemeine Neuordnung, die ich brauche, ist, alle Daten als Spalten mit nur 1 Zeile pro TXT-Datei verfügbar zu machen. Für jede Datenzeile in der TXT-Datei sollten sich hier 3 Spalten in der Ausgabedatei befinden (Vordergrund%, Datenpixel% und Häufigkeit für jede Farbe). Der Name der Zeile sollte der Bildname sein, der am Anfang der Datei angegeben ist, hier: 20130815 104359 875 000000 0528 0548

er Rest kann weggelassen werde

Die Ausgabe sollte ungefähr so aussehen:

Ich arbeite gleichzeitig daran, bin mir aber nicht sicher, in welche Richtung ich gehen soll. Jede Hilfe ist also mehr als willkommen!

Best, Moritz

Antworten auf die Frage(4)

Ihre Antwort auf die Frage