Resultados da pesquisa a pedido "dataframe"

2 a resposta

Como forçar o inferSchema for CSV a considerar números inteiros como datas (com a opção "dateFormat")?

Eu uso o Spark 2.2.0 Estou lendo um arquivo csv da seguinte maneira: val dataFrame = spark.read.option("inferSchema", "true") .option("header", true) .option("dateFormat", "yyyyMMdd") .csv(pathToCSVFile)Há uma coluna de data neste arquivo e ...

5 a resposta

Como unir dois quadros de dados para os quais os valores da coluna estão dentro de um determinado intervalo?

Dados dois quadros de dadosdf_1 edf_2, como juntá-los a essa coluna datetimedf_1 está no meiostart eend no dataframedf_2: print df_1 timestamp A B 0 2016-05-14 10:54:33 0.020228 0.026572 1 2016-05-14 10:54:34 0.057780 0.175499 2 2016-05-14 ...

2 a resposta

Alternativas à indexação estranha de Pandas / Python Dataframe: df_REPEATED [df_REPEATED ['var']]> 0?

No Pandas / Python, tenho que escrever o nome do quadro de dados duas vezes ao condicionar em sua própria variável: df_REPEATED[df_REPEATED['var']>0]Isso acontece tantas vezes que parece irracional. 90-99% dos usuários ficariam felizes 95% do ...

2 a resposta

Como criar uma variável de classificação sob certas condições?

Meus dados contêm variável de tempo e variável de marca escolhida, conforme abaixo. time indica o horário da compra e a marca escolhida indica a marca comprada no momento. Com esses dados, eu gostaria de criar uma variável de classificação, ...

3 a resposta

R- Fazendo referência a diferentes quadros de dados em um loop

Eu sou novo no R, então se estou pensando sobre isso completamente errado, sinta-se à vontade para me dizer. Eu tenho uma série de quadros de dados importados em usinas de energia, um de cada ano (Plant1987, Plant1988 etc ...) que estou tentando ...

2 a resposta

Booleano para valor exclusivo em uma coluna

Para meu quadro de dados, p. df = pd.DataFrame([1, 3, 7, 1], columns=['data'])Quero saber para cada índice se o valor é único na colunadata. Portanto, o quadro de dados resultante deve ser data is_unique 0 1 False 1 3 True 2 7 True 3 1 ...

1 a resposta

Mesclagem externa de dois quadros de dados no pandas

Como posso mesclar externamente dois quadros de dados no pandas? Por exemplo, suponha que temos esses dois quadros de dados: import pandas as pd s1 = pd.DataFrame({ 'time':[1234567000,1234567005,1234567009], ...

3 a resposta

Como adicionar dados de um quadro de dados para outro usando a transposição do Pandas?

Objetivo:preencher um quadro de dados com outro usando transpose df = pd.DataFrame({'Attributes': ['love', 'family','tech']}) df.TProduz esta saída: 0 1 2 Attributes love family techSecundariamente, eu tenho outro quadro de dados que está ...

1 a resposta

Stack Spark dataframes horizontalmente - equivalente a pandas concat ou r cbind

Existe uma maneira de acrescentar umdataframe horizontalmente para outro - supondo que ambos tenham número idêntico de linhas? Isso seria o equivalente apandas concat poraxis=1; result = pd.concat([df1, df4], axis=1)ou oR cbind

1 a resposta

Mapeando valores com base nas colunas 'de' e 'para' em um quadro de dados

Eu tenho um exemplo de dataframe de pandas abaixo. From|to 01|03 05|09 03|02 02|06O final_value deve ser atualizado com os dados mais recentes, ou seja, 01 é alterado para 03 posteriormente 03 é alterado para 02 e assim por diante 02 é alterado ...