Wydajny odczyt określonych linii z dużych plików do R
Jestem zaskoczony, jak długo R potrzebuje odczytać w określonej linii z dużego pliku (11 GB +). Na przykład:
> t0 = Sys.time()
> read.table('data.csv', skip=5000000, nrows=1, sep=',')
V1 V2 V3 V4 V5 V6 V7
1 19.062 56.71047 1 16 8 2006 56281
> print(Sys.time() - t0)
Time difference of 49.68314 secs
Terminal OSX może natychmiast zwrócić określoną linię. Czy ktoś zna bardziej skuteczny sposób w R?