Textdatei mit mehreren Leerzeichen als Trennzeichen in R lesen
Ich habe einen großen Datensatz, der aus rund 94 Spalten und 3 Millionen Zeilen besteht. Diese Datei enthält sowohl einzelne als auch mehrere Leerzeichen als Trennzeichen zwischen den Spalten. Ich muss einige Spalten aus dieser Datei in R lesen. Dazu habe ich read.table () mit Optionen verwendet, die im folgenden Code zu sehen sind. Der Code wird unten eingefügt.
### Defining the columns to be read from the file, the first 5 column, then we do not read next 24, after this we read next 5 columns. Last 60 columns are not read in-
col_classes = c(rep("character",2), rep("numeric", 3), rep("NULL",24), rep("numeric", 5), rep("NULL", 60))
### Reading first 100 rows of the data
data <- read.table(file, sep = " ",header = F, nrows = 100, na.strings ="", stringsAsFactors= F)
Da die Datei, die eingelesen werden soll, mehr als ein Leerzeichen als Trennzeichen zwischen einigen Spalten enthält, funktioniert die obige Methode nicht. Gibt es eine Methode, mit der wir diese Datei effizient einlesen können?