Resultados de la búsqueda a petición "awk"

3 la respuesta

¿Cómo preprocesar y cargar un archivo tsv de "big data" en un marco de datos de Python?

Actualmente estoy tratando de importar el siguiente archivo delimitado por tabulaciones grandes en una estructura similar a un marco de datos dentro de Python --- naturalmente estoy usandopandas marco de datos, aunque estoy abierto a otras ...

3 la respuesta

Conversión de archivo .csv grande a .prn (alrededor de 3,5 GB) en Ubuntu usando bash

Tengo un archivo .csv que es muy grande y tiene un tamaño de aproximadamente 3.5 GB, ya que estoy tratando con grandes datos y necesito convertir este archivo a un archivo .prn que separa las columnas con delimitador de espacio. Aquí están los ...

1 la respuesta

Usando awk para interpolar la columna de datos basada en un archivo de datos con fecha y hora

El siguiente archivo tiene varias columnas con fecha, hora y un conjunto de datos incompleto como se muestra usando un archivo simple # Matrix.txt 13.09.2016:23:44:10;;4.0 13.09.2016:23:44:20;10.0; 13.09.2016:23:44:30;; ...

4 la respuesta

Fusionar valores para la misma clave

¿Es eso posible de usar?awk a valores de la misma clave en una fila? Por ejemplo a,100 b,200 a,131 a,102 b,203 b,301¿Puedo convertirlos a un archivo como este: a,100,131,102 b,200,203,301

1 la respuesta

sed / awk: devuelve filas que coinciden con ciertas cadenas en la segunda columna

Tengo un archivo csv en HDFS que estoy usando fread () para leer en R. Los datos se ven así: Date Code Value TransactionID 2016-01-01 769 123 16U11863C2MS0000337625C1 2016-02-01 2MS-US 456 16U11863C2MS0000337626C1 2016-03-01 E9E-US ...

7 la respuesta

¿Cómo imprimir columnas una tras otra en bash?

¿Hay algún método mejor para imprimir dos o más columnas en una columna, por ejemplo? fichero de entrada AAA 111 BBB 222 CCC 333salida: AAA BBB CCC 111 222 333Solo puedo pensar en: cut -f1 input.file >output.file;cut -f2 input.file ...

5 la respuesta

awk para eliminar filas duplicadas totalmente basadas en un valor de columna particular

Tengo un conjunto de datos como: 6 AA_A_56_30018678_E 0 30018678 P A 6 SNP_A_30018678 0 30018678 A G 6 SNP_A_30018679 0 30018679 T G 6 SNP_A_30018682 0 30018682 T G 6 SNP_A_30018695 0 30018695 G C 6 AA_A_62_30018696_Q 0 30018696 P A 6 ...

6 la respuesta

Bash: ordenar el archivo de texto por último valor de campo

Tengo un archivo de texto que contiene ~ 300k filas. Cada fila tiene un número variable de campos delimitados por comas, el último de los cuales es numérico garantizado. Quiero ordenar el archivo por este último campo numérico. No ...

2 la respuesta

usar shell para iterar a través de un archivo

Tengo dos archivos de entrada. Uno tiene una lista de nombres, forma mm: dd, duración del uso y otras cosas de nombres de host en cada línea. El otro es el que generé que tiene un conjunto de nombres en cada línea que no se repite. Estoy tratando ...

1 la respuesta

Arreglando archivos csv rotos usando awk

Tengo algunos archivos csv que están rotos porque hay basura, como caracteres de control, entradas y delimitadores en algunos de los campos. Un ejemplo de datos de maqueta sin caracteres de control: id;col 1;col 2;col 3 1;data 11;good 21;data 31 ...