Resultados da pesquisa a pedido "dataframe"

1 a resposta

Data.frame torna-se fator / vetor após filtragem / subconjunto

Eu tenho um data.frame com uma coluna, assim: >d = data.frame(animal=c("horse","dog","cat"))então eu o filtrei excluindo todos os itens também presentes em um vetor. por exemplo.: > res = d[!(d$animal %in% c("horse")),] > res [1] dog cat ...

2 a resposta

Corresponda as linhas do quadro de dados de acordo com duas variáveis (indexação)

Estou essencialmente tentando obter dados desorganizados em forma longa para modelagem linear. Eu tenho 2 data.frames "rec" e "book" Cada linha no "livro" precisa ser colada no final de várias linhas de "rec" de acordo com duas variáveis na ...

1 a resposta

Criando / acessando dataframe dentro da transformação de outro dataframe

Estou atualizando algum código existente para usar o Spark. Eu tenho vários quadros de dados que contêm conjuntos de dados diferentes. Ao transformar meu quadro de dados principal (ou meu conjunto de dados principal), preciso usar dados de outros ...

3 a resposta

PySpark, principal para DataFrame

O que eu quero fazer é um DataFrame, pegue os n elementos principais de acordo com alguma coluna especificada. O topo (self, num) na API RDD é exatamente o que eu quero. Gostaria de saber se existe API equivalente no mundo DataFrame? Minha ...

1 a resposta

Exclua linhas duplicadas com o mesmo valor em todas as colunas nos pandas

Eu tenho um quadro de dados com cerca de meio milhão de linhas. Como pude ver, há muitas linhas duplicadas; portanto, como posso remover linhas duplicadas com o mesmo valor em todas as colunas (cerca de 80 colunas), e não apenas em ...

4 a resposta

Derretendo um dataframe de pandas

Eu tenho um quadro de dados como este NSW VIC 0 6718023 5023203 1 6735528 5048207 2 6742690 5061266 3 6766133 5083593 4 6786160 5103965Eu quero mudar assim 0 6718023 NSW 1 6735528 NSW 2 6742690 NSW 3 6766133 NSW 4 6786160 NSW 5 5023203 VIC 6 ...

1 a resposta

Problemas ao adicionar uma nova coluna a um quadro de dados - spark / scala

Eu sou novo no spark / scala. Estou tentando ler alguns dados de uma tabela de seção para um dataframe spark e adicionar uma coluna com base em alguma condição. Aqui está o meu código: val DF = hiveContext.sql("select * from (select * from ...

2 a resposta

python conta quantas vezes uma string está presente na linha inteira de um dataframe do pandas

Eu tenho uma pergunta com base no meu anteriorPergunta, questão [https://stackoverflow.com/questions/48330608/pandas-dataframe-search-sting-in-the-entire-row] . O código abaixo funciona bem e me diz se osearch_string está presente na ...

1 a resposta

converter índice em coluna panda dataframe

Eu tenho os seguintes pandas dataframe: | id | LocTime |ZPos | XPos datetime | 2017-01-02 00:14:39 |20421902611| 12531245409231| 0 | -6 2017-01-02 00:14:40 |30453291020| 28332479673070| 0 | -2 Quero converter o índice de data e hora na coluna do ...

1 a resposta

Configuração do formato da tabela de saída pandas.DataFrame

Onde posso configurar o Jupyter para fazer com que um objeto DataFrame apareça comotabela de borda completapor padrão? Agora fica assim: [/imgs/CHbnW.jpg] Eu gostaria que pudesse parecer com: [/imgs/VmxT7.jpg]