Resultados da pesquisa a pedido "dataframe"

4 a resposta

Limites práticos do quadro de dados R

Eu tenho lido sobre como read.table não é eficiente para arquivos de dados grandes. Além disso, como R não é adequado para grandes conjuntos de dados. Então, eu queria saber onde posso encontrar quais são os limites práticos e quaisquer gráficos ...

10 a resposta

Como soltar colunas pelo nome em um quadro de dados

Eu tenho um grande conjunto de dados e gostaria de ler colunas específicas ou descartar todas as outras. data <- read.dta("file.dta")Eu seleciono as colunas nas quais não estou interessado: var.out <- names(data)[!names(data) %in% c("iden", ...

7 a resposta

Em R, qual é a diferença entre df [“x”] e df $ x

Onde posso encontrar informações sobre as diferenças entre chamar uma coluna dentro de um data.frame via: df <- data.frame(x=1:20,y=letters[1:20],z=20:1) df$x df["x"]Ambos retornam os resultados "mesmos", mas não necessariamente no mesmo ...

6 a resposta

Como adiciono uma nova coluna a um Spark DataFrame (usando PySpark)?

Eu tenho um Spark DataFrame (usando o PySpark 1.5.1) e gostaria de adicionar uma nova coluna. Eu tentei o seguinte sem sucesso: type(randomed_hours) # => list # Create in Python and transform to RDD new_col = pd.DataFrame(randomed_hours, ...

3 a resposta

Erro do Pandas “Só pode usar o acessador .str com valores de string”

Eu tenho o seguinte arquivo de entrada: "Name",97.7,0A,0A,65M,0A,100M,5M,75M,100M,90M,90M,99M,90M,0#,0N#,E eu estou lendo isso com: #!/usr/bin/env python import pandas as pd import sys import numpy as np filename = sys.argv[1] df = ...

3 a resposta

Converter arquivo csv não estruturado em um quadro de dados

Estou aprendendo R para mineração de texto. Eu tenho uma programação de programas de TV em forma de CSV. Os programas geralmente começam às 06:00 e continuam até às 05:00 do dia seguinte, que é chamado de dia de transmissão. Por exemplo: os ...

1 a resposta

Classificação computacional de uma linha

Quero classificar o ID do usuário com base em um campo. Para o mesmo valor do campo, a classificação deve ser a mesma. Esses dados estão na tabela do Hive. por exemplo. user value a 5 b 10 c 5 d 6 Rank a - 1 c - 1 d - 3 b - 4Como eu posso ...

2 a resposta

O dataframe do Spark transforma várias linhas em coluna

Eu sou um novato para despertar, e querotransformarabaixodataframe de origem (carregar do arquivo JSON): +--+-----+-----+ |A |count|major| +--+-----+-----+ | a| 1| m1| | a| 1| m2| | a| 2| m3| | a| 3| m4| | b| 4| m1| | b| 1| m2| | b| 2| m3| | c| ...

1 a resposta

Os números das linhas diferem (NA vs 1) ao adicionar a primeira linha aos dados vazios.

Eu gostaria de entender por que esses dois métodos para indexar um vaziodata.frame resultar em umNA número da linha que está sendo atribuído à primeira linhasó: Método 1: df <- data.frame(Number=numeric(), Text=character(), stringsAsFactors = ...

7 a resposta

Forma pitônica / eficiente de remover o espaço em branco de cada célula do quadro de dados do Pandas que possui um objeto semelhante a uma string

Estou lendo um arquivo CSV em um DataFrame. Preciso remover o espaço em branco de todas as células semelhantes a strings, deixando as outras células inalteradas no Python 2.7. Aqui está o que estou fazendo: def remove_whitespace( x ): if ...