Resultados de la búsqueda a petición "awk"
¿Cómo preprocesar y cargar un archivo tsv de "big data" en un marco de datos de Python?
Actualmente estoy tratando de importar el siguiente archivo delimitado por tabulaciones grandes en una estructura similar a un marco de datos dentro de Python --- naturalmente estoy usandopandas marco de datos, aunque estoy abierto a otras ...
Conversión de archivo .csv grande a .prn (alrededor de 3,5 GB) en Ubuntu usando bash
Tengo un archivo .csv que es muy grande y tiene un tamaño de aproximadamente 3.5 GB, ya que estoy tratando con grandes datos y necesito convertir este archivo a un archivo .prn que separa las columnas con delimitador de espacio. Aquí están los ...
Usando awk para interpolar la columna de datos basada en un archivo de datos con fecha y hora
El siguiente archivo tiene varias columnas con fecha, hora y un conjunto de datos incompleto como se muestra usando un archivo simple # Matrix.txt 13.09.2016:23:44:10;;4.0 13.09.2016:23:44:20;10.0; 13.09.2016:23:44:30;; ...
Fusionar valores para la misma clave
¿Es eso posible de usar?awk a valores de la misma clave en una fila? Por ejemplo a,100 b,200 a,131 a,102 b,203 b,301¿Puedo convertirlos a un archivo como este: a,100,131,102 b,200,203,301
sed / awk: devuelve filas que coinciden con ciertas cadenas en la segunda columna
Tengo un archivo csv en HDFS que estoy usando fread () para leer en R. Los datos se ven así: Date Code Value TransactionID 2016-01-01 769 123 16U11863C2MS0000337625C1 2016-02-01 2MS-US 456 16U11863C2MS0000337626C1 2016-03-01 E9E-US ...
¿Cómo imprimir columnas una tras otra en bash?
¿Hay algún método mejor para imprimir dos o más columnas en una columna, por ejemplo? fichero de entrada AAA 111 BBB 222 CCC 333salida: AAA BBB CCC 111 222 333Solo puedo pensar en: cut -f1 input.file >output.file;cut -f2 input.file ...
awk para eliminar filas duplicadas totalmente basadas en un valor de columna particular
Tengo un conjunto de datos como: 6 AA_A_56_30018678_E 0 30018678 P A 6 SNP_A_30018678 0 30018678 A G 6 SNP_A_30018679 0 30018679 T G 6 SNP_A_30018682 0 30018682 T G 6 SNP_A_30018695 0 30018695 G C 6 AA_A_62_30018696_Q 0 30018696 P A 6 ...
Bash: ordenar el archivo de texto por último valor de campo
Tengo un archivo de texto que contiene ~ 300k filas. Cada fila tiene un número variable de campos delimitados por comas, el último de los cuales es numérico garantizado. Quiero ordenar el archivo por este último campo numérico. No ...
usar shell para iterar a través de un archivo
Tengo dos archivos de entrada. Uno tiene una lista de nombres, forma mm: dd, duración del uso y otras cosas de nombres de host en cada línea. El otro es el que generé que tiene un conjunto de nombres en cada línea que no se repite. Estoy tratando ...
Arreglando archivos csv rotos usando awk
Tengo algunos archivos csv que están rotos porque hay basura, como caracteres de control, entradas y delimitadores en algunos de los campos. Un ejemplo de datos de maqueta sin caracteres de control: id;col 1;col 2;col 3 1;data 11;good 21;data 31 ...