Результаты поиска по запросу "dataframe"
Спасибо Прем! Это действительно будет работать. Однако я понял, что это немного медленнее, чем хотелось бы, так как мы собираем данные для драйвера, а затем перепараллеливаем список с DataFrame. Прямо сейчас я предпочитаю подход оконной функции, предложенный. @Garren
то я хочу сделать, это дать DataFrame, взять верхние n элементов в соответствии с некоторым указанным столбцом. Вершина (self, num) в RDD API - это именно то, что я хочу. Интересно, есть ли в мире DataFrame эквивалентный API? Моя первая попытка ...
Вы можете попробовать следующее -
я есть следующая структура панд: col1 col2 col3 text 1 1 0 meaningful text 5 9 7 trees 7 8 2 textЯ хотел бы векторизовать его с помощью векторизатора tfidf. Это, однако, возвращает матрицу разбора, которую я могу фактически превратить в плотную ...
подход, но не требуется иметь дело с именами столбцов.
я есть этот df1: A B C 1 2 3 5 7 9гдеA B C имена столбцов. У меня есть другой df2 с одним столбцом: A 1 2 3 4Я хотел бы добавить df2 для каждого столбца df1, создавая этот окончательный кадр данных: A B C 1 2 3 5 7 9 1 1 1 2 2 2 3 3 3 4 4 ...
Да, иногда я это слишком усложнял. ;)
я есть этот фрейм данных, где ожидается, что пол будет мужской или женский. from io import StringIO import pandas as pd audit_trail = StringIO(''' course_id AcademicYear_to months TotalFee Gender 260 2017 24 100 male 260 2018 12 140 male 274 ...
верный! Спасибо :)
от вопрос уже есть ответ здесь: Панды Слияния 101 [/questions/53645882/pandas-merging-101] 1 ответу меня есть датафрейм id store address 1 100 xyz 2 200 qwe 3 300 asd 4 400 zxc 5 500 bnmу меня есть другой датафрейм df2 serialNo store_code ...
Это держит. Порядок пунктов в шаблоне соответствия, который вы связали, не имеет значения.
ользую Spark 2.2.0 Я читаю CSV-файл следующим образом: val dataFrame = spark.read.option("inferSchema", "true") .option("header", true) .option("dateFormat", "yyyyMMdd") .csv(pathToCSVFile)В этом файле есть один столбец даты, и все записи имеют ...
stackoverflow.com/questions/961162/...
рабатываю приложение с Python и QT GUI. Мне нужно импортировать файл вDataFrame, Я используюQFileDialog.getOpenFileName чтобы получить путь и имя файла, чтобы открыть его сpandas.read_csv метод. Все работает хорошо, пока я не получу путь со ...
Еще одна работа вокруг:
отрим этот простой фрейм данных: a b 0 1 2 1 2 3Я выполняю.apply в качестве таких: In [4]: df.apply(lambda x: [x.values]) Out[4]: a [[140279910807944, 140279910807920]] b [[140279910807944, 140279910807920]] dtype: object In ...
колонка, чтобы сделать это более понятным.
м, у меня есть следующие данные: {"id":1, "payload":[{"foo":1, "lol":2},{"foo":2, "lol":2}]}Я хотел бы взорвать полезную нагрузку и добавить столбец, например: df = df.select('id', F.explode('payload').alias('data')) df ...
ой ну спасибо. Надеюсь, datacamp не использует видеоуроки. Мне легче читать. Еще раз спасибо!
я есть набор данных из 240 дел, в котором я хочу создать пустую строку после каждой существующей строки. Оставив мне 480 строк, из которых половина заполнена, а другая половина пуста (которую я затем хочу заполнить некоторыми данными ...