Результаты поиска по запросу "pandas"
Есть ли хороший способ избежать глубокого копирования памяти или сократить время, затрачиваемое на многопроцессорность?
Я делаю модуль вычисления «больших данных» на основе памяти в режиме реального времени, используя модуль Pandas среды Python. Поэтому время отклика является качеством этого модуля и очень критично и важно. Для обработки большого набора данных я ...
Нахождение общих рядов (пересечение) в двух фреймах данных Pandas
Предположим, у меня есть два кадра данных этого формата (назовите ихdf1 а такжеdf2): +------------------------+------------------------+--------+ | user_id | business_id | rating | +------------------------+------------------------+--------+ ...
Групповые операции над столбцом Pandas, содержащим списки
У меня есть DataFrame, содержащий столбец,props, который содержит списки строк. В идеале я бы хотел сгруппировать по этому столбцу, но я, как и ожидалось, получаю сообщение об ошибке: TypeError: unhashable type: 'list'Есть ли разумный способ ...
сохранить гистограмму pandas.Series в файл
В ipython Notebook сначала создайте объект Series pandas, затем, вызвав метод экземпляра .hist (), браузер отобразит рисунок. Мне интересно, как сохранить эту фигуру в файл (я имею в виду не щелчок правой кнопкой мыши и сохранить как, а команды, ...
Сравнение панд вызывает TypeError: невозможно сравнить dtyped массив [float64] со скаляром типа [bool]
У меня есть следующая структура для моего dataFrame: Index: 1008 entries, Trial1.0 to Trial3.84 Data columns (total 5 columns): CHUNK_NAME 1008 non-null values LAMBDA 1008 non-null values BETA 1008 non-null values HIT_RATE 1008 non-null values ...
Панды: использовать iterrows в подмножестве Dataframe
Каков наилучший способ сделать это с подмножеством DataFrame? Давайте рассмотрим следующий простой пример: import pandas as pd df = pd.DataFrame({ 'Product': list('AAAABBAA'), 'Quantity': [5,2,5,10,1,5,2,3], 'Start' : [ ...
Попытка удалить NaN проиндексированную строку в кадре данных
Я использую Python 2.7.3 и Pandas версии 0.12.0. Я хочу удалить строку с индексом NaN, чтобы у меня были только допустимые значения site_id. print df.head() special_name site_id NaN Banana OMG Apple df.drop(df.index[0]) TypeError: 'NoneType' ...
кадр данных панд - выбрать строки и очистить память?
У меня есть большой информационный фрейм панд (размер = 3 ГБ): x = read.table ('big_table.txt', sep = '\ t', header = 0, index_col = 0) Поскольку я работаю в условиях ограниченного объема памяти, я размещаю подкадр данных: row = Calculate_rows ...
Панды: создавать именованные столбцы в DataFrame из dict
У меня есть словарь объекта формы: my_dict = {id1: val1, id2: val2, id3: val3, ...}Я хочу создать это в DataFrame, где я хочу назвать 2 столбца «business_id» и «business_code». Я пытался: business_df ...
Среднее время для списка datetime
Ищем самое быстрое решение проблемы усреднения по времени. У меня есть список объектов даты и времени. Нужно найти среднее значение времени (исключая год, месяц, день). Вот что я получил так далеко: import datetime as dtm def avg_time(times): ...