La forma más rápida de obtener datos de un CSV en C ++
Tengo un gran CSV (75 MB aproximadamente) de este tipo:
1,2,4
5,2,0
1,6,3
8,3,1
...
Y almaceno mis datos con este código:
#include <sstream>
#include <fstream>
#include <vector>
int main()
{
char c; // to eat the commas
int x, y, z;
std::vector<int> xv, yv, zv;
std::ifstream file("data.csv");
std::string line;
while (std::getline(file, line)) {
std::istringstream ss(line);
ss >> x >> c >> y >> c >> z;
xv.push_back(x);
yv.push_back(y);
zv.push_back(z);
}
return 0;
}
Y me llevó en este gran CSV (~ 75MB):
real 0m7.389s
user 0m7.232s
sys 0m0.132s
Eso es mucho!
Recientemente, usando un fragmento de texto sublime, encontré otra forma de leer un archivo:
#include <iostream>
#include <vector>
#include <cstdio>
int main()
{
std::vector<char> v;
if (FILE *fp = fopen("data.csv", "r")) {
char buf[1024];
while (size_t len = fread(buf, 1, sizeof(buf), fp))
v.insert(v.end(), buf, buf + len);
fclose(fp);
}
}
Y me llevó (sin obtener datos) en este gran CSV (~ 75MB):
real 0m0.118s
user 0m0.036s
sys 0m0.080s
¡Esa es una gran diferencia a tiempo!
¡La pregunta es cómo puedo obtener los datos en 3 vectores de una manera más rápida en un vector de caracteres! No sé cómo puedo hacerlo de una manera más rápida que la primera propuesta.
¡Muchas gracias! ^^