Результаты поиска по запросу "dataframe"
можешь выложить рабочий код ..
ужно извлечь таблицу из Teradata (доступ только для чтения) для паркета с Scala (2.11) / Spark (2.1.0). Я строю фрейм данных, который я могу успешно загрузить val df = spark.read.format("jdbc").options(options).load()Ноdf.show дает ...
да, Боже, это функция окидоки выше, на самом деле: D. Мой вопрос, почему это так?
отрим этот простой пример import pandas as pd df = pd.DataFrame({'one' : [1,2,3], 'two' : [1,0,0]}) df Out[9]: one two 0 1 1 1 2 0 2 3 0Я хочу написать функцию, которая принимает в качестве входных данных фрейм данныхdf и столбецmycol. Теперь ...
Альтернатива версии @coldspeed:
аюсь отфильтровать кадр данных панды, используя пороги для трех столбцов import pandas as pd df = pd.DataFrame({"A" : [6, 2, 10, -5, 3], "B" : [2, 5, 3, 2, 6], "C" : [-5, 2, 1, 8, 2]}) df = df.loc[(df.A > 0) & (df.B > 2) & (df.C ...
Огромное спасибо. Я посмотрю в эти ссылки.
адр данных: A B C 0 6 2 -5 1 2 5 2 2 10 3 1 3 -5 2 8 4 3 6 2Я мог бы получить столбец, который в основном кортеж столбцов из оригиналаdf с помощьюdf.apply: out = df.apply(tuple, 1) print(out) 0 (6, 2, -5) 1 (2, 5, 2) 2 (10, 3, 1) 3 (-5, 2, 8) 4 ...
Должен был повторить, а не плитка. сортировать не нужно (-:
я есть такой фрейм NSW VIC 0 6718023 5023203 1 6735528 5048207 2 6742690 5061266 3 6766133 5083593 4 6786160 5103965Я хочу изменить это так 0 6718023 NSW 1 6735528 NSW 2 6742690 NSW 3 6766133 NSW 4 6786160 NSW 5 5023203 VIC 6 5048207 VIC 7 ...
@ i.n.n.m Хм, да. Чисто.
я есть список списка, который я хотел бы сделать его в ряд. Ближайший, который я получил, использовал этоПочта [https://stackoverflow.com/questions/19112398/getting-list-of-lists-into-pandas-dataframe] , Однако я не смог получить ...
Да, я мог бы просто сделать это после того, как потрачу некоторое время на решение проблемы.
ифицирую существующий код для использования Spark. У меня есть несколько фреймов данных, которые содержат разные наборы данных. При преобразовании моего основного фрейма данных (или моего основного набора данных) мне нужно использовать данные из ...
Если вы просто пытаетесь добавить новую запись, я предлагаю использовать rbind.
у вставить строки между двумя датами по группам. Мой способ сделать это настолько сложен, что я вставляю пропущенные значения при последнем наблюдении, переносе вперед и затем слиянии. Мне было интересно, есть ли более простой способ добиться ...
для имени кадра данных и столбца, который вы меняете
от вопрос уже есть ответ здесь: Конвертировать из миллиарда в миллион и наоборот [/questions/38013217/convert-from-billion-to-million-and-vice-versa] 6 ответов Как следует из названия, я ищу способ преобразования сокращенного текста «символа» в ...
Результатом являются значения между 2016-10-01 и 2017-04-01.
кто-нибудь объяснить мне, почему я получаю разные результаты для этих двух выражений? Я пытаюсь отфильтровать 2 даты: df.filter("act_date <='2017-04-01'" and "act_date >='2016-10-01'")\ .select("col1","col2").distinct().count()Результат: ...