Resultados de la búsqueda a petición "dataframe"

2 la respuesta

Filtrar dinámicamente un marco de datos de pandas

Estoy tratando de filtrar un marco de datos de pandas usando umbrales para tres columnas import pandas as pd df = pd.DataFrame({"A" : [6, 2, 10, -5, 3], "B" : [2, 5, 3, 2, 6], "C" : [-5, 2, 1, 8, 2]}) df = df.loc[(df.A > 0) & (df.B > 2) & (df.C ...

1 la respuesta

¿Por qué funciona df.apply (tuple) pero no df.apply (list)?

Aquí hay un marco de datos: A B C 0 6 2 -5 1 2 5 2 2 10 3 1 3 -5 2 8 4 3 6 2Podría recuperar una columna que es básicamente una tupla de columnas del originaldf utilizandodf.apply: out = df.apply(tuple, 1) print(out) 0 (6, 2, -5) 1 (2, 5, 2) 2 ...

1 la respuesta

NullPointerException después de extraer una tabla Teradata con Scala / Spark

Necesito extraer una tabla de Teradata (acceso de solo lectura) al parquet con Scala (2.11) / Spark (2.1.0). Estoy construyendo un marco de datos que puedo cargar con éxito val df = spark.read.format("jdbc").options(options).load()Perodf.show me ...

2 la respuesta

Máscara booleana del marco de datos de pandas en varias columnas

Tengo un marco de datos (df) que contiene varias columnas con una medida real y el número correspondiente de columnas (A, B, ...) con una incertidumbre (dA, dB, ...) para cada una de estas columnas: A B dA dB 0 -1 3 0.31 0.08 1 2 -4 0.263 0.357 ...

3 la respuesta

Los pandas de Python se agrupan en varias columnas, luego pivotan

En Python, tengo un DataFrame de pandas similar al siguiente: Item | shop1 | shop2 | shop3 | Category ------------------------------------ Shoes| 45 | 50 | 53 | Clothes TV | 200 | 300 | 250 | Technology Book | 20 | 17 | 21 | Books phone| 300 | ...

1 la respuesta

Python: crea un marco de datos de pandas a partir de una lista

Estoy usando el siguiente código para crear un marco de datos a partir de una lista: test_list = ['a','b','c','d'] df_test = pd.DataFrame.from_records(test_list, columns=['my_letters']) df_testEl código anterior funciona bien. Luego probé ...

1 la respuesta

Salida incómoda de mode () en pandas Dataframe

Tengo un marco de datos con varias columnas (las características). >>> print(df) col1 col2 a 1 1 b 2 2 c 3 3 d 3 2Me gustaría calcular el modo de uno de ellos. Esto es lo que pasa: >>> print(df['col1'].mode()) 0 3 dtype: int64Me gustaría ...

4 la respuesta

Seleccione una lista de sectores de un marco de datos de múltiples índices / columnas de pandas

Digamos que tengo el siguiente marco de datos Pandas multicolumna: arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', ], ['one', 'two', 'one', 'two', 'one', 'two', ]] tuples = list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples, ...

1 la respuesta

Cómo mostrar valores no numéricos del marco de datos

Marco de datos: Measure|Value -------|---- A|1000 B|1000/ C|1000* D|10 E|1000 0 F|1000 G|5.. H|2 I|w K|288 L| M|565Resultados: Measure|Value -------|---- B|1000/ C|1000* D|10 E|1000 0 G|5.. I|w L|En SQL uso la consulta: select Measure,Value ...

2 la respuesta

Agregar tfidf al marco de datos de pandas

Tengo la siguiente estructura de pandas: col1 col2 col3 text 1 1 0 meaningful text 5 9 7 trees 7 8 2 textMe gustaría vectorizarlo usando un vectorizador tfidf. Sin embargo, esto devuelve una matriz de análisis, que en realidad puedo convertir en ...