Результаты поиска по запросу "dataframe"

0 ответов

Вы можете задавать неправильный вопрос. collect_list потянет все в одного исполнителя. Таким образом, вопрос должен быть, есть ли шанс, который взорвется на вас Если это так, вы должны использовать UDAF. Если нет никакой возможности взорвать collect_list, используйте udf + collect_list.

асто приходится выполнять пользовательские агрегации на фреймах данных в spark 2.1, и я использовал эти два подхода: использование groupby / collect_list для получения всех значений в одной строке, а затем применение UDF для агрегирования ...

0 ответов

Спасибо за ваши усилия, вопрос решен.

я есть количество строк в списке, как ' [1,] "Home" [2,] "A" [3,] "B" [4,] "C" [5,] "Home" [6,] "D" [7,] "E" [8,] "Home" [9,] "F" [10,] "G" [11,] "H" [12,] "I"эти строки идут динамически ... после "Home" может быть две, три, четыре, пять или ...

0 ответов

 столбец может быть другим.

у найти разницу, сравнивая два DataFrames и объединяя различия в новый DataFrame, но есть проблема, когда значения отсутствуют в одном из DataFrames, генерируется ошибка:ValueError: Can only compare identically-labeled Series objects Я думаю, что ...

ТОП публикаций

0 ответов

 dtype для целых чисел, даже со структурированными массивами.

оздать структурированный массив из двух столбцов в DataFrame? Я попробовал это: df = pd.DataFrame(data=[[1,2],[10,20]], columns=['a','b']) df a b 0 1 2 1 10 20 x = np.array([([val for val in list(df['a'])], [val for val in list(df['b'])])]) Но ...

0 ответов

Есть идеи, как бы я это сделал?

я есть датафрейм df1, который выглядит так rootID parentID jobID time 0 A A B 2019-01-30 14:33:21.339469 1 A A C 2019-01-30 14:33:21.812381 2 A C D 2019-01-30 15:33:21.812381 3 E E F 2019-01-30 15:33:21.812381 4 E F G 2019-01-30 16:33:21.812381 ...

0 ответов

Да не причём

одстановке data.frame внутри списка я получаю векторы вместо data.frames (см. Пример ниже). Как избежать этого и получить data.frames? l <- list(data.frame(a=c(1,2,3)), data.frame(b=c(4,5,6,5)), data.frame(c=c(3,4,5,6))) names(l) <- c("A", "B", ...

0 ответов

Довольно распечатать всю серию Pandas / DataFrame

Я много работаю с Series и DataFrames на терминале. По умолчанию__repr__ для серии возвращает уменьшенную выборку с некоторыми значениями головы и хвоста, но остальные отсутствуют. Есть ли встроенный способ красивой печати всей серии / ...

0 ответов

Комбинированная полоса и линейный график с пандами [дубликаты]

На этот вопрос уже есть ответ: Как показать гистограмму и линейный график на одном графике [/questions/19941685/how-to-show-a-bar-and-line-graph-on-the-same-plot] 3 ответа График Pandas DataFrame в виде столбца и линии на одном ...

1 ответ

Rcpp: рекомендуемая структура кода при использовании фреймов данных с Rcpp (inline)

1 ответ

Фрейм данных XML для панд

У меня есть XML-файл с тысячами строк, таких как: