Результаты поиска по запросу "pandas"

2 ответа

 немного изменить данные в

я есть таблица, как показано ниже: URN Firm_Name 0 104472 R.X. Yah & Co 1 104873 Big Building Society 2 109986 St James's Society 3 114058 The Kensington Society Ltd 4 113438 MMV Oil Associates LtdИ я хочу посчитать частоту всех слов в столбце ...

1 ответ

@roganjosh Тебе не нужно верить мне, просто прими это сам.

ель - сделать вызов API для каждой строки в DataFrame Pandas, который содержит список строк в JSON ответа, и создать новый DataFrame с одной строкой на ответ. Мой код в основном выглядит так: i = 0 new_df = pandas.DataFrame(columns = ...

1 ответ

CSV-файл Pandas с дополнительными столбцами посередине

Я обрабатываю много (тысячи) CSV-файлов ~ 100 тыс. Строк, созданных кем-то другим. 9 раз из 10 файлов имеют 8 столбцов, и с миром все в порядке. В 10-й раз или около 10 строк будет вставлено 2 дополнительных столбца после столбца 6: (Для простоты ...

ТОП публикаций

1 ответ

Чтение CSV, содержащего список в Pandas

Я пытаюсь прочитать этот CSV в панд HK,"[u'5328.1', u'5329.3', '2013-12-27 13:58:57.973614']" HK,"[u'5328.1', u'5329.3', '2013-12-27 13:58:59.237387']" HK,"[u'5328.1', u'5329.3', '2013-12-27 13:59:00.346325']"Как вы можете видеть, есть только 2 ...

2 ответа

https://pandas.pydata.org/pandas-docs/stable/indexing.html#the-query-method

аружил метод панд DataFrame.query и егопочти делает именно то, что мне было нужно (и реализовал свой собственный синтаксический анализатор, так как я не понял, что он существует, но на самом деле я должен был использовать стандартный метод). Я ...

3 ответа

Вы можете растопить и позвонить to_records:

я есть следующееpandas dataframe import pandas as pd a = [2.5,3.3] b = [3.6,3.9] D = {'A': a, 'B': b}что дает мне что-то вроде +---+-----+-----+ | | A | B | +---+-----+-----+ | 0 | 2.5 | 3.3 | | 1 | 3.6 | 3.9 | +---+-----+-----+Я хочу ...

1 ответ

@Bharathshetty (это c #), и я искал утилиту для панд, которая могла бы сделать это для меня. ;-) Аналогично анализатору CSV от pandas для определения разделителей CSV.

ассив значений даты и времени: array = np.array(['2016-05-01T00:00:59.3+10:00', '2016-05-01T00:02:59.4+10:00', '2016-05-01T00:03:59.4+10:00', '2016-05-01T00:13:00.1+10:00', '2016-05-01T00:22:00.5+10:00', '2016-05-01T00:31:01.1+10:00'], ...

2 ответа

В качестве альтернативы, используя арифметические операторы:

я есть датафрейм id lat long 1 12.654 15.50 2 14.364 25.51 3 17.636 32.53 5 12.334 25.84 9 32.224 15.74Я хочу найти евклидово расстояние этих координат от конкретного местоположения, сохраненного в списке L1 L1 = [11.344,7.234]я хочу создать ...

3 ответа

 решение.

то я пытаюсь получить, это разделить несколько значений ячеек на несколько строк, а затем получить только строку, которая имеет большее значение числа в столбце fruit_weight. У меня есть следующий формат: fruit_type;fruit_color;fruit_weight ...

2 ответа

Я бы включил

аюсь показать три верхних значенияnc_type за каждый месяц. Я пытался с помощьюn_largest но это не делает это по дате. Исходные данные: area nc_type occurred_date 0 Filling x 12/23/2015 0:00 1 Filling f 12/22/2015 0:00 2 Filling s 9/11/2015 0:00 ...