Resultados da pesquisa a pedido "dataframe"

2 a resposta

read_csv não lê os nomes das colunas corretamente neste arquivo?

Eu tenho um arquivo csv da seguinte maneira: 0 5 1 10 2 15 3 20 4 25Quero salvá-lo como um quadro de dados com eixos x, y como nomes e depois plotá-lo. No entanto, quando atribuox,y Recebo um DataFrame bagunçado, o que está ...

2 a resposta

buscar mais de 20 linhas e exibir o valor total da coluna no shell de faísca

estou usandoCassandraSQLContext do spark-shell para consultar dados do Cassandra. Então, eu quero saber duas coisas: como buscar mais de 20 linhas usandoCassandraSQLContext e segundo, como o ID exibe o valor total da coluna. Como você pode ver ...

2 a resposta

DataFrame multidimensional / aninhado / conjunto de dados / painel no Pandas

Gostaria de armazenar alguns dados multidimensionais em um quadro ou painel de dados do pandas para que eu pudesse retornar, por exemplo: Todas as vezes para o corredor A, corrida ATodos os horários (e nomes) da Corrida A por um determinado ano ...

4 a resposta

Substituindo os valores duplicados, exceto 1 linha no dataframe R

Como posso substituir os valores duplicados de uma coluna específica do dataframe R para NA (exceto a primeira linha) com base no ID. Para dar um exemplo: x <- data.frame(id=c("p1","p1","p1","p2","p2"),date=c("d1","d1","d1","d2","d2")) e deve ...

3 a resposta

R excluir linhas no quadro de dados onde nrow do índice é menor que determinado valor

Desejo excluir determinadas linhas em um quadro de dados quando o número de linhas com o mesmo índice for menor que um valor pré-especificado. > fof.6.5[1:15, 1:3] draw Fund.ID Firm.ID 1 1 1667 666 2 1 1572 622 3 1 1392 553 4 1 248 80 5 1 3223 ...

5 a resposta

Como dividir dados em 3 conjuntos (treinamento, validação e teste)?

Eu tenho um dataframe de pandas e desejo dividi-lo em 3 conjuntos separados. Eu sei que usandotrain_test_split [http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.train_test_split.html] desklearn.cross_validation, é ...

2 a resposta

Localizando linhas no dataframe R onde um valor de coluna segue uma sequência

Eu tenho um quadro de dados como abaixo, que é uma saída de um classificador. col1, class 123, 2 122, 5 124, 7 125, 9 126, 15 127, 2 128, 19 129, 5 130, 7 179, 9 180, 3Eu quero encontrar as linhas que têm um certo padrão de classe, como todas as ...

4 a resposta

Alterando vários nomes de colunas, mas nem todos - Pandas Python

Gostaria de saber se existe uma função para alterar nomes de colunas específicos, mas sem selecionar um nome específico ou sem alterar todos eles. Eu tenho o código: df=df.rename(columns = {'nameofacolumn':'newname'})Mas com isso eu tenho ...

1 a resposta

Usando r para navegar e raspar uma página da web com formulários suspensos em html

Estou tentando raspar dados dehttp://www.footballoutsiders.com/stats/snapcounts [http://www.footballoutsiders.com/stats/snapcounts], mas não posso alterar os campos nas caixas suspensas do site ("equipe", "semana", "posição" e "ano"). Minha ...

3 a resposta

Recuperar n top em cada grupo de um DataFrame no pyspark

Há um DataFrame no pyspark com os dados abaixo: user_id object_id score user_1 object_1 3 user_1 object_1 1 user_1 object_2 2 user_2 object_1 5 user_2 object_2 2 user_2 object_2 6O que eu espero é retornar 2 registros em cada grupo com o mesmo ...