Resultados da pesquisa a pedido "dataframe"
Como forçar o inferSchema for CSV a considerar números inteiros como datas (com a opção "dateFormat")?
Eu uso o Spark 2.2.0 Estou lendo um arquivo csv da seguinte maneira: val dataFrame = spark.read.option("inferSchema", "true") .option("header", true) .option("dateFormat", "yyyyMMdd") .csv(pathToCSVFile)Há uma coluna de data neste arquivo e ...
Como unir dois quadros de dados para os quais os valores da coluna estão dentro de um determinado intervalo?
Dados dois quadros de dadosdf_1 edf_2, como juntá-los a essa coluna datetimedf_1 está no meiostart eend no dataframedf_2: print df_1 timestamp A B 0 2016-05-14 10:54:33 0.020228 0.026572 1 2016-05-14 10:54:34 0.057780 0.175499 2 2016-05-14 ...
Alternativas à indexação estranha de Pandas / Python Dataframe: df_REPEATED [df_REPEATED ['var']]> 0?
No Pandas / Python, tenho que escrever o nome do quadro de dados duas vezes ao condicionar em sua própria variável: df_REPEATED[df_REPEATED['var']>0]Isso acontece tantas vezes que parece irracional. 90-99% dos usuários ficariam felizes 95% do ...
Como criar uma variável de classificação sob certas condições?
Meus dados contêm variável de tempo e variável de marca escolhida, conforme abaixo. time indica o horário da compra e a marca escolhida indica a marca comprada no momento. Com esses dados, eu gostaria de criar uma variável de classificação, ...
R- Fazendo referência a diferentes quadros de dados em um loop
Eu sou novo no R, então se estou pensando sobre isso completamente errado, sinta-se à vontade para me dizer. Eu tenho uma série de quadros de dados importados em usinas de energia, um de cada ano (Plant1987, Plant1988 etc ...) que estou tentando ...
Booleano para valor exclusivo em uma coluna
Para meu quadro de dados, p. df = pd.DataFrame([1, 3, 7, 1], columns=['data'])Quero saber para cada índice se o valor é único na colunadata. Portanto, o quadro de dados resultante deve ser data is_unique 0 1 False 1 3 True 2 7 True 3 1 ...
Mesclagem externa de dois quadros de dados no pandas
Como posso mesclar externamente dois quadros de dados no pandas? Por exemplo, suponha que temos esses dois quadros de dados: import pandas as pd s1 = pd.DataFrame({ 'time':[1234567000,1234567005,1234567009], ...
Como adicionar dados de um quadro de dados para outro usando a transposição do Pandas?
Objetivo:preencher um quadro de dados com outro usando transpose df = pd.DataFrame({'Attributes': ['love', 'family','tech']}) df.TProduz esta saída: 0 1 2 Attributes love family techSecundariamente, eu tenho outro quadro de dados que está ...
Stack Spark dataframes horizontalmente - equivalente a pandas concat ou r cbind
Existe uma maneira de acrescentar umdataframe horizontalmente para outro - supondo que ambos tenham número idêntico de linhas? Isso seria o equivalente apandas concat poraxis=1; result = pd.concat([df1, df4], axis=1)ou oR cbind
Mapeando valores com base nas colunas 'de' e 'para' em um quadro de dados
Eu tenho um exemplo de dataframe de pandas abaixo. From|to 01|03 05|09 03|02 02|06O final_value deve ser atualizado com os dados mais recentes, ou seja, 01 é alterado para 03 posteriormente 03 é alterado para 02 e assim por diante 02 é alterado ...