Lendo arquivo de texto com vários espaços como delimitador em R
Eu tenho grande conjunto de dados que consistem em cerca de 94 colunas e 3 milhões de linhas. Este arquivo tem espaços únicos e múltiplos como delimitador entre colunas. Eu preciso ler algumas colunas deste arquivo em R. Para isso eu tentei usar read.table () com opções que podem ser vistas no código abaixo, o código é colado abaixo-
### Defining the columns to be read from the file, the first 5 column, then we do not read next 24, after this we read next 5 columns. Last 60 columns are not read in-
col_classes = c(rep("character",2), rep("numeric", 3), rep("NULL",24), rep("numeric", 5), rep("NULL", 60))
### Reading first 100 rows of the data
data <- read.table(file, sep = " ",header = F, nrows = 100, na.strings ="", stringsAsFactors= F)
Como o arquivo que precisa ler tem mais de um espaço como o delimitador entre algumas colunas, o método acima não funciona. Existe algum método usando o qual podemos ler neste arquivo de forma eficiente.