Resultados da pesquisa a pedido "dataframe"

2 a resposta

somar valores de colunas começando com a mesma sequência no quadro de dados do pandas

Eu tenho um quadro de dados com cerca de 100 colunas que se parece com Id Economics-1 English-107 English-2 History-3 Economics-zz Economics-2 \ 0 56 1 1 0 1 0 0 1 11 0 0 0 0 1 0 2 6 0 0 1 0 0 1 3 43 0 0 0 1 0 1 4 14 0 1 0 0 1 0 Histo ...

1 a resposta

O Spark do filtro DataFrame na string contém

estou usandoSpark 1.3.0 [http://spark.apache.org/releases/spark-release-1-3-0.html]eSpark Avro 1.0.0 [https://github.com/databricks/spark-avro/tree/c5612df9b1a9768689fec91655faa2a7073fd9fc#spark-sql-avro-library] . Estou trabalhando deo exemplo ...

5 a resposta

Subconfigurando um quadro de dados para as linhas que não aparecem em outro quadro de dados

Eu tenho um quadro de dados A com observações Var1 Var2 Var3 1 3 4 2 5 6 4 5 7 4 5 8 6 7 9e quadro de dados B com observações Var1 Var2 Var3 1 3 4 2 5 6que é basicamente um subconjunto de A. Agora, quero selecionar observações em A NÃO em B, ou ...

1 a resposta

Como faço para testar valores numéricos em um quadro de dados de caracteres e convertê-los em numéricos?

Eu tenho um dataframe parecido com o seguinte: > theDF ID Ticker INDUSTRY_SECTOR VAR CVAR 1 1 USD CASH 0 0 12 2 ZAR CASH -181412.82055904 -301731.22832191 23 3 BAT SJ EQUITY Financial 61711.951234826 102641.162795691 34 4 HCI SJ EQUITY Financial ...

3 a resposta

Agregação múltipla em grupo por no Dataframe do Pandas

SQL : Select Max(A) , Min (B) , C from Table group by CEu quero fazer a mesma operação em pandas em um dataframe. Quanto mais perto eu chegava era: DF2= DF1.groupby(by=['C']).max()onde eu acabo obtendo o máximo de ambas as colunas, como faço ...

5 a resposta

Como detecto se um Spark DataFrame tem uma coluna

Quando eu crio umDataFrame de um arquivo JSON no Spark SQL, como posso saber se existe uma determinada coluna antes de chamar.select Exemplo de esquema JSON: { "a": { "b": 1, "c": 2 } }Isto é o que eu quero fazer: potential_columns = Seq("b", ...

1 a resposta

Python - Pandas - Gravar Dataframe no CSV

Estou tentando escrever um arquivo de dataframe de 4 tabelas, 3 colunas e 50 linhas em um CSV usando pandas. Estou recebendo o seguinte erroAttributeError: 'dict' object has no attribute 'to_csv'. Acredito que estou escrevendo a ...

4 a resposta

Filtrando um Pyspark DataFrame com a cláusula IN do tipo SQL

Eu quero filtrar um Pyspark DataFrame com um SQLIN cláusula, como em sc = SparkContext() sqlc = SQLContext(sc) df = sqlc.sql('SELECT * from my_df WHERE field1 IN a')Ondea é a tupla(1, 2, 3). Estou recebendo este ...

3 a resposta

Selecionando dados do quadro de dados do Pandas com base nos critérios armazenados em um dict

Eu tenho um quadro de dados do Pandas que contém um grande número de variáveis. Isso pode ser simplificado como: tempDF = pd.DataFrame({ 'var1': [12,12,12,12,45,45,45,51,51,51], 'var2': ['a','a','b','b','b','b','b','c','c','d'], ...

3 a resposta

Verifique se certo valor está contido em uma coluna de quadro de dados nos pandas [duplicado]

Esta pergunta já tem uma resposta aqui: Como filtrar linhas que contêm um padrão de seqüência de caracteres de um dataframe do Pandas [duplicado] [/questions/27975069/how-to-filter-rows-containing-a-string-pattern-from-a-pandas-dataframe] 4 ...