Результаты поиска по запросу "dataframe"

3 ответа

В некотором смысле имеет смысл, что вы можете маркировать кортежи, как это ... приятно.

я есть df, который я группирую по двум столбцам. Я хочу посчитать каждую группу последовательно. Код ниже подсчитывает каждую строку в группе последовательно. Это кажется легче, чем я думаю, но не могу понять это. df = pd.DataFrame({ 'Key': ...

1 ответ

Вне:

я есть panda dataframe с несколькими столбцами, которые смешаны со значениями и нежелательными символами. columnA columnB columnC ColumnD \x00A\X00B NULL \x00C\x00D 123 \x00E\X00F NULL NULL 456то, что я хотел бы сделать, это сделать этот кадр ...

1 ответ

@JNg - Добро пожаловать! Очень хороший вопрос;)

я есть датафрейм со значениями, аналогичными приведенным ниже A10d B10d C10d A B C Strategy 20 10 5 3 5 1 3Стратегия выбирает максимум A10d, B10d, C10d и возвращает значение A, B, C. В этом случае A10d является наибольшим, и стратегия возвращает ...

ТОП публикаций

2 ответа

 не будет работать в Python 3, я отредактировал ваш ответ, чтобы исправить его, но получил отказ. :(

ужно удалитьколонкас этикеткойимяво время загрузки CSV с помощьюpandas, Я читаю CSV следующим образом и хочу добавить параметры внутри него, чтобы сделать это. Благодарю. pd.read_csv("sample.csv") Я знаю, что делать после прочтения ...

1 ответ

 столы выглядят идеально!

могу настроить Jupyter, чтобы объект DataFrame отображался какполноценный стол по умолчанию? Теперь это выглядит так: [/imgs/CHbnW.jpg] Я бы хотел, чтобы это выглядело так: [/imgs/VmxT7.jpg]

2 ответа

@coldspeed Я не понимаю, вы можете помочь, как импортировать и сохранять. Можете ли вы дать мне весь код, пожалуйста, помогите мне

мер, у нас есть CSV-файл с name age address john 25 koramangala banglore #@ sales maneger %$ india harshuth rao 36 belandur banglore #@ maneger %$ india vijay kumar 45 ulsoor banglore #@ sales maneger %$ india suhas 25 koramangala banglore ...

1 ответ

@pyd - рад помочь!

я есть 3 df's: df1=pd.DataFrame({"Name":["one","two","three"],"value":[4,5,6]}) df2=pd.DataFrame({"Name":["four","one","three"],"value":[8,6,2]}) df3=pd.DataFrame({"Name":["one","four","six"],"value":[1,1,1]})Я могу добавить один за другим, но я ...

1 ответ

Второй подход - именно то, что мне нужно. Спасибо

уйста, учтите это df: df = pd.DataFrame({'a':[1,2], 'b':[1,2], 'c':[1,2], 'd':[1,2], 'e':[1,2], 'f':[1,2], 'g':[1,2], 'h':[1,2]}) a b c d e f g h 0 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2Как выбрать 1-й, 4-й и 5-й и 7-й столбцы? Что я ...

0 ответов

Вы можете задавать неправильный вопрос. collect_list потянет все в одного исполнителя. Таким образом, вопрос должен быть, есть ли шанс, который взорвется на вас Если это так, вы должны использовать UDAF. Если нет никакой возможности взорвать collect_list, используйте udf + collect_list.

асто приходится выполнять пользовательские агрегации на фреймах данных в spark 2.1, и я использовал эти два подхода: использование groupby / collect_list для получения всех значений в одной строке, а затем применение UDF для агрегирования ...

2 ответа

Вы можете объединить свои отдельные кадры данных, а затем сгруппировать по ключевому столбцу:

я есть два кадра данных df1 Name class value Sri 1 5 Ram 2 8 viv 3 4 df2 Name class value Sri 1 5 viv 4 4Мой желаемый результат, df, Name class value Sri 2 10 Ram 2 8 viv 7 8Пожалуйста, помогите, спасибо заранее!