Einige Probleme beim Lesen einer Datei mit der Funktion cbc.read.table in R + mithilfe des Filters beim Lesen von Dateien

a) Ich versuche mit der Funktion eine relativ große .txt-Datei zu lesencbc.read.table von demcolbycol Paket in R. Entsprechend dem, was ich in diesem Paket gelesen habe, wird die Arbeit einfacher, wenn wir große Dateien haben (mehr als ein GB, das in R gelesen werden muss) und wir nicht alle Spalten / Variablen für unsere Analyse benötigen. Auch habe ich gelesen, dass die Funktioncbc.read.table könnte das gleiche unterstützenread.tableParameter von. Allerdings, wenn ich den Parameter übergebenrows (Um eine Vorschau meiner Datei in R zu erhalten) Ich erhalte die folgende Fehlermeldung:

#My line code. I'm just reading columns 5,6,7,8 out of 27
i.can <- cbc.read.table( "xxx.txt", header = T, sep = "\t",just.read=5:8, nrows=20)
#error message
Error in read.table(file, nrows = 50, sep = sep, header = header, ...) : 
formal argument "nrows" matched by multiple actual arguments

Meine Frage lautet also: Können Sie mir sagen, wie ich dieses Problem lösen kann?

b) Danach habe ich versucht, alle Instanzen mit folgendem Code zu lesen:

i.can.b <- cbc.read.table( "xxx.txt", header = T, sep = "\t",just.read=4:8) #done perfectly
my.df <- as.data.frame(i.can.b) #getting error in this line
Error in readSingleKey(con, map, key) : unable to obtain value for key 'Company' #Company is a string column in my data set

Meine Frage lautet also erneut: Wie kann ich das lösen?

c) Kennen Sie eine Methode, mit der ich beim Lesen von Dateien (nach Bedingungen für Instanzen) filtern kann?

Antworten auf die Frage(1)

Ihre Antwort auf die Frage