Resultados da pesquisa a pedido "dataframe"

4 a resposta

Como criar bons exemplos reproduzíveis do Apache Spark

Passei bastante tempo lendo algumas perguntas com opyspark [/questions/tagged/pyspark]espark-dataframe [/questions/tagged/spark-dataframe] tags e, muitas vezes, acho que os pôsteres não fornecem informações suficientes para entender realmente a ...

2 a resposta

Carregar dados CSV no Dataframe e converter em matriz usando o Apache Spark (Java)

Eu tenho um arquivo CSV com os dados abaixo: 1,2,5 2,4 2,3Eu quero carregá-los em um Dataframe com esquema de seqüência de caracteres da matriz A saída deve ser como abaixo. [1, 2, 5] [2, 4] [2, 3]Isso foi respondido usando o scala aqui:Spark: ...

1 a resposta

O Apache Spark subtrai dias da coluna timestamp

Estou usando o Spark Dataset e estou com problemas para subtrair dias de uma coluna de carimbo de data / hora. Gostaria de subtrair os dias da coluna Timestamp e obter uma nova coluna com o formato completo de data e hora. Exemplo: 2017-09-22 ...

1 a resposta

grupo de pandas: TOP 3 valores para cada grupo

Uma pergunta nova e mais genérica foi publicada empandas groupby: TOP 3 valores em cada grupo e loja no ...

4 a resposta

R - erro ao separar texto de uma string usando a condição regex e ifelse

O que eu quero fazer é retirar o texto de uma string sempre que houver um ":". Suponha que meu texto contenha: text$Text[[3]] = "There is a horror movie running in the iNox theater. : Can we go?"E o que eu quero criar um quadro de dados ...

1 a resposta

Adicionando uma coluna nunique agregada e agrupada ao dataframe do pandas

Quero adicionar uma coluna agregada, agrupada e núnica ao meu quadro de dados do pandas, mas não agregar todo o quadro de dados. Estou tentando fazer isso em uma linha e evitar criar um novo objeto agregado e mesclar isso, etc. meu df tem faixa, ...

1 a resposta

Verifique se há várias palavras na correspondência de cadeias para procurar texto em r

Atualmente, tenho um código que funciona para uma pesquisa por palavra. Podemos pesquisar várias palavras e escrever essas palavras correspondentes em um quadro de dados? (para esclarecimentos, consulte ...

2 a resposta

Converter um quadro de dados python com várias linhas em uma linha usando pandas python?

Com o seguinte quadro de dados, df = pd.DataFrame({'device_id' : ['0','0','1','1','2','2'], 'p_food' : [0.2,0.1,0.3,0.5,0.1,0.7], 'p_phone' : [0.8,0.9,0.7,0.5,0.9,0.3] }) print(df) resultado: device_id p_food p_phone 0 0 0.2 0.8 1 0 0.1 0.9 2 1 ...

4 a resposta

Achatar várias colunas em um quadro de dados em uma única coluna

Eu tenho um quadro de dados como este: id other_id_1 other_id_2 other_id_3 1 100 101 102 2 200 201 202 3 300 301 302Eu quero isso: id other_id 1 100 1 101 1 102 2 200 2 201 2 202 3 300 3 301 3 302Posso obter facilmente a saída desejada ...

4 a resposta

Pandas - dataframe groupby - como obter soma de várias colunas

Deve ser fácil, mas de alguma forma não consegui encontrar uma solução que funcione. Eu tenho um dataframe de pandas que se parece com isso: index col1 col2 col3 col4 col5 0 a c 1 2 f 1 a c 1 2 f 2 a d 1 2 f 3 b d 1 2 g 4 b e 1 2 g 5 b e 1 2 ...