Результаты поиска по запросу "dataframe"

3 ответа

Спасибо Прем! Это действительно будет работать. Однако я понял, что это немного медленнее, чем хотелось бы, так как мы собираем данные для драйвера, а затем перепараллеливаем список с DataFrame. Прямо сейчас я предпочитаю подход оконной функции, предложенный. @Garren

то я хочу сделать, это дать DataFrame, взять верхние n элементов в соответствии с некоторым указанным столбцом. Вершина (self, num) в RDD API - это именно то, что я хочу. Интересно, есть ли в мире DataFrame эквивалентный API? Моя первая попытка ...

1 ответ

Вы можете попробовать следующее -

я есть следующая структура панд: col1 col2 col3 text 1 1 0 meaningful text 5 9 7 trees 7 8 2 textЯ хотел бы векторизовать его с помощью векторизатора tfidf. Это, однако, возвращает матрицу разбора, которую я могу фактически превратить в плотную ...

9 ответов

 подход, но не требуется иметь дело с именами столбцов.

я есть этот df1: A B C 1 2 3 5 7 9гдеA B C имена столбцов. У меня есть другой df2 с одним столбцом: A 1 2 3 4Я хотел бы добавить df2 для каждого столбца df1, создавая этот окончательный кадр данных: A B C 1 2 3 5 7 9 1 1 1 2 2 2 3 3 3 4 4 ...

ТОП публикаций

2 ответа

Да, иногда я это слишком усложнял. ;)

я есть этот фрейм данных, где ожидается, что пол будет мужской или женский. from io import StringIO import pandas as pd audit_trail = StringIO(''' course_id AcademicYear_to months TotalFee Gender 260 2017 24 100 male 260 2018 12 140 male 274 ...

2 ответа

верный! Спасибо :)

от вопрос уже есть ответ здесь: Панды Слияния 101 [/questions/53645882/pandas-merging-101] 1 ответу меня есть датафрейм id store address 1 100 xyz 2 200 qwe 3 300 asd 4 400 zxc 5 500 bnmу меня есть другой датафрейм df2 serialNo store_code ...

2 ответа

Это держит. Порядок пунктов в шаблоне соответствия, который вы связали, не имеет значения.

ользую Spark 2.2.0 Я читаю CSV-файл следующим образом: val dataFrame = spark.read.option("inferSchema", "true") .option("header", true) .option("dateFormat", "yyyyMMdd") .csv(pathToCSVFile)В этом файле есть один столбец даты, и все записи имеют ...

2 ответа

stackoverflow.com/questions/961162/...

рабатываю приложение с Python и QT GUI. Мне нужно импортировать файл вDataFrame, Я используюQFileDialog.getOpenFileName чтобы получить путь и имя файла, чтобы открыть его сpandas.read_csv метод. Все работает хорошо, пока я не получу путь со ...

1 ответ

Еще одна работа вокруг:

отрим этот простой фрейм данных: a b 0 1 2 1 2 3Я выполняю.apply в качестве таких: In [4]: df.apply(lambda x: [x.values]) Out[4]: a [[140279910807944, 140279910807920]] b [[140279910807944, 140279910807920]] dtype: object In ...

1 ответ

 колонка, чтобы сделать это более понятным.

м, у меня есть следующие данные: {"id":1, "payload":[{"foo":1, "lol":2},{"foo":2, "lol":2}]}Я хотел бы взорвать полезную нагрузку и добавить столбец, например: df = df.select('id', F.explode('payload').alias('data')) df ...

3 ответа

ой ну спасибо. Надеюсь, datacamp не использует видеоуроки. Мне легче читать. Еще раз спасибо!

я есть набор данных из 240 дел, в котором я хочу создать пустую строку после каждой существующей строки. Оставив мне 480 строк, из которых половина заполнена, а другая половина пуста (которую я затем хочу заполнить некоторыми данными ...