Resultados da pesquisa a pedido "pandas"

1 a resposta

Identifique os clusters vinculados por delta à esquerda e delta diferente à direita

Considere a matriz classificadaa: a = np.array([0, 2, 3, 4, 5, 10, 11, 11, 14, 19, 20, 20])Se eu especificasse deltas esquerdo e direito, delta_left, delta_right = 1, 1Então é assim que eu esperaria que os clusters fossem atribuídos: # a = [ 0 ...

2 a resposta

O que é as_index em groupby em pandas?

Qual é exatamente a função deas_index nogroupby em pandas?

6 a resposta

Alguma maneira de obter mapeamentos de um codificador de rótulo em pandas Python?

Estou convertendo seqüências de caracteres para valores categóricos no meu conjunto de dados usando o seguinte trecho de código. data['weekday'] = pd.Categorical.from_array(data.weekday).labelsPor exemplo, index weekday 0 Sunday 1 Sunday 2 ...

4 a resposta

Como derreter o Spark DataFrame?

Existe um equivalente da função Pandas Melt no Apache Spark no PySpark ou pelo menos no Scala? Eu estava executando um exemplo de conjunto de dados até agora em python e agora quero usar o Spark para todo o conjunto de dados. Desde já, obrigado.

4 a resposta

Personalizando o separador no pandas read_csv

Estou lendo muitos arquivos de dados diferentes em vários quadros de dados de pandas. As colunas nesses arquivos de dados são separadas por espaços. No entanto, para cada arquivo, o número de espaços é diferente (para alguns, há apenas um espaço, ...

1 a resposta

Dataframe set_index não está configurando

Eu tenho um dataframe e estou tentando definir o índice para a coluna 'Timestamp'. Atualmente, o índice é apenas um número de linha. Um exemplo do formato do carimbo de data e hora é:2015-09-03 16:35:00 Eu tentei definir o ...

3 a resposta

Como aplicar pos_tag_sents () ao dataframe do pandas com eficiência

Nas situações em que você deseja marcar com tag uma coluna de texto armazenada em um dataframe do pandas com 1 frase por linha, a maioria das implementações no SO usa o método apply dfData['POSTags']= dfData['SourceText'].apply( lamda ...

4 a resposta

Como salvar uma nova planilha em um arquivo excel existente, usando o Pandas?

Eu quero usar arquivos do Excel para armazenar dados elaborados com python. Meu problema é que não consigo adicionar planilhas a um arquivo excel existente. Aqui, sugiro um código de exemplo para trabalhar para alcançar esse problema import ...

1 a resposta

Raspagem na Web com Selenium Python [Twitter + Instagram]

Estou tentando raspar o Instagram e o Twitter com base na geolocalização. Posso executar uma pesquisa de consulta, mas estou tendo dificuldades em recarregar a página da Web para mais e armazenar os campos no quadro de dados. Eu encontrei alguns ...

3 a resposta

Criando dataframe de pandas com índice de data e hora e valores aleatórios na coluna

Como crio um dataframe do pandas com data e hora como índice e valores aleatórios para uma coluna. Atualmente, tenho este: from datetime import datetime, timedelta date_today = datetime.now() date_end = date_today + timedelta(7) df = ...