Resultados da pesquisa a pedido "dataframe"
Como criar um DataFrame vazio com um esquema especificado?
Eu quero criar emDataFrame com um esquema especificado no Scala. Tentei usar a leitura JSON (refiro-me à leitura de arquivos vazios), mas não acho que seja a melhor prática.
Não foi possível converter o quadro de dados em objeto h2o
Estou executando o pacote h2o no Rstudio versão 0.99.447. Eu executo a versão 10.9.5 OSX. Gostaria de configurar um cluster local no R, seguindo as etapas deste ...
Usando cadeias sintaticamente difíceis como nomes de colunas em um quadro de dados
Estou trabalhando com um quadro de dados semelhante ao extrato abaixo: df <- data.frame(A=c("Some messy string to be used",222,0), B=c("Very important ? indicator from 2001", 888, 44), C=c("001 This variable / makes no sense", 888, 44), ...
Preencha os valores de data ausentes na coluna adicionando intervalo de entrega a outra coluna de data
Dados: DB1 <- data.frame(orderItemID = 1:10, orderDate = c("2013-01-21","2013-03-31","2013-04-12","2013-06-01","2014-01-01", "2014-02-19","2014-02-27","2014-10-02","2014-10-31","2014-11-21"), deliveryDate = c("2013-01-23", "2013-03-01", "NA", ...
Uso do método spark as DataFrame “as”
estou olhando paraspark.sql.DataFrame [https://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.sql.DataFrame] documentação. Há sim def as(alias: String): DataFrame Returns a new DataFrame with an alias set. Since 1.3.0Qual é ...
Qual a diferença entre iloc, ix e loc?
Alguém pode explicar como esses três métodos de fatiar são diferentes? eu tenho vistoos documentos [http://pandas.pydata.org/pandas-docs/stable/indexing.html]e eu ...
pandas groupby contar ocorrência de seqüência de caracteres sobre a coluna
Quero contar a ocorrência de uma seqüência de caracteres em uma coluna agrupada de dados do pandas. Suponha que eu tenho o seguinte Dataframe: catA catB scores A X 6-4 RET A X 6-4 6-4 A Y 6-3 RET B Z 6-0 RET B Z 6-1 RET Primeiro, quero agrupar ...
como alternar linhas de colunas em um dataframe do pandas
Eu tenho o seguinte quadro de dados: 0 1 0 enrichment_site value 1 last_updated value 2 image_names value 3 shipping_weight value 4 ean_gtin value 5 stockqty value 6 height__mm value 7 availability value 8 rrp value 9 sku value 10 price_band ...
Substituir nulos no DataFrame por Max na linha
Existe uma maneira (mais eficiente do que usar um loop for) de substituir todos os nulos no DataFrame de um Pandas pelo valor máximo em sua respectiva linha.
Obter o nome de um DataFrame de pandas
Como obtenho o nome de um DataFrame e o imprimo como uma string? Exemplo: boston (nome do var atribuído a um arquivo csv) boston = read_csv('boston.csv') print ('The winner is team A based on the %s table.) % boston