Resultados da pesquisa a pedido "dataframe"
Como criar bons exemplos reproduzíveis do Apache Spark
Passei bastante tempo lendo algumas perguntas com opyspark [/questions/tagged/pyspark]espark-dataframe [/questions/tagged/spark-dataframe] tags e, muitas vezes, acho que os pôsteres não fornecem informações suficientes para entender realmente a ...
Carregar dados CSV no Dataframe e converter em matriz usando o Apache Spark (Java)
Eu tenho um arquivo CSV com os dados abaixo: 1,2,5 2,4 2,3Eu quero carregá-los em um Dataframe com esquema de seqüência de caracteres da matriz A saída deve ser como abaixo. [1, 2, 5] [2, 4] [2, 3]Isso foi respondido usando o scala aqui:Spark: ...
O Apache Spark subtrai dias da coluna timestamp
Estou usando o Spark Dataset e estou com problemas para subtrair dias de uma coluna de carimbo de data / hora. Gostaria de subtrair os dias da coluna Timestamp e obter uma nova coluna com o formato completo de data e hora. Exemplo: 2017-09-22 ...
grupo de pandas: TOP 3 valores para cada grupo
Uma pergunta nova e mais genérica foi publicada empandas groupby: TOP 3 valores em cada grupo e loja no ...
R - erro ao separar texto de uma string usando a condição regex e ifelse
O que eu quero fazer é retirar o texto de uma string sempre que houver um ":". Suponha que meu texto contenha: text$Text[[3]] = "There is a horror movie running in the iNox theater. : Can we go?"E o que eu quero criar um quadro de dados ...
Adicionando uma coluna nunique agregada e agrupada ao dataframe do pandas
Quero adicionar uma coluna agregada, agrupada e núnica ao meu quadro de dados do pandas, mas não agregar todo o quadro de dados. Estou tentando fazer isso em uma linha e evitar criar um novo objeto agregado e mesclar isso, etc. meu df tem faixa, ...
Verifique se há várias palavras na correspondência de cadeias para procurar texto em r
Atualmente, tenho um código que funciona para uma pesquisa por palavra. Podemos pesquisar várias palavras e escrever essas palavras correspondentes em um quadro de dados? (para esclarecimentos, consulte ...
Converter um quadro de dados python com várias linhas em uma linha usando pandas python?
Com o seguinte quadro de dados, df = pd.DataFrame({'device_id' : ['0','0','1','1','2','2'], 'p_food' : [0.2,0.1,0.3,0.5,0.1,0.7], 'p_phone' : [0.8,0.9,0.7,0.5,0.9,0.3] }) print(df) resultado: device_id p_food p_phone 0 0 0.2 0.8 1 0 0.1 0.9 2 1 ...
Achatar várias colunas em um quadro de dados em uma única coluna
Eu tenho um quadro de dados como este: id other_id_1 other_id_2 other_id_3 1 100 101 102 2 200 201 202 3 300 301 302Eu quero isso: id other_id 1 100 1 101 1 102 2 200 2 201 2 202 3 300 3 301 3 302Posso obter facilmente a saída desejada ...
Pandas - dataframe groupby - como obter soma de várias colunas
Deve ser fácil, mas de alguma forma não consegui encontrar uma solução que funcione. Eu tenho um dataframe de pandas que se parece com isso: index col1 col2 col3 col4 col5 0 a c 1 2 f 1 a c 1 2 f 2 a d 1 2 f 3 b d 1 2 g 4 b e 1 2 g 5 b e 1 2 ...