Einige Probleme beim Lesen einer Datei mit der Funktion cbc.read.table in R + mithilfe des Filters beim Lesen von Dateien
a) Ich versuche mit der Funktion eine relativ große .txt-Datei zu lesencbc.read.table
von demcolbycol
Paket in R. Entsprechend dem, was ich in diesem Paket gelesen habe, wird die Arbeit einfacher, wenn wir große Dateien haben (mehr als ein GB, das in R gelesen werden muss) und wir nicht alle Spalten / Variablen für unsere Analyse benötigen. Auch habe ich gelesen, dass die Funktioncbc.read.table
könnte das gleiche unterstützenread.table
Parameter von. Allerdings, wenn ich den Parameter übergebenrows
(Um eine Vorschau meiner Datei in R zu erhalten) Ich erhalte die folgende Fehlermeldung:
#My line code. I'm just reading columns 5,6,7,8 out of 27
i.can <- cbc.read.table( "xxx.txt", header = T, sep = "\t",just.read=5:8, nrows=20)
#error message
Error in read.table(file, nrows = 50, sep = sep, header = header, ...) :
formal argument "nrows" matched by multiple actual arguments
Meine Frage lautet also: Können Sie mir sagen, wie ich dieses Problem lösen kann?
b) Danach habe ich versucht, alle Instanzen mit folgendem Code zu lesen:
i.can.b <- cbc.read.table( "xxx.txt", header = T, sep = "\t",just.read=4:8) #done perfectly
my.df <- as.data.frame(i.can.b) #getting error in this line
Error in readSingleKey(con, map, key) : unable to obtain value for key 'Company' #Company is a string column in my data set
Meine Frage lautet also erneut: Wie kann ich das lösen?
c) Kennen Sie eine Methode, mit der ich beim Lesen von Dateien (nach Bedingungen für Instanzen) filtern kann?