Результаты поиска по запросу "pandas"

1 ответ

@ Темно Может быть ... но я не думаю, что это предназначено для работы с пандами.

лизирую данные пандыdf1 содержащий строки строк У меня есть список ключевых слов и мне нужно удалить каждую строку вdf1 содержащий любое слово из списка литературы. В настоящее время я делаю это так: reference_list: ["words", "to", "remove"] ...

2 ответа

Мне также интересно, если мой подход сам по себе полностью неверен

мой код. Я знаю, почему ошибка происходит во время преобразования. Это из-за несоответствия списка возможностей во время подгонки и преобразования. Как я могу решить это? Как я могу получить 0 для всех остальных функций? После этого я хочу ...

1 ответ

@ Вэнь, с новым годом. Я ответил и вернулся, чтобы насладиться последним днем ​​отпуска, поэтому пропустил сообщение :)

должен преобразовать значение NaN в категориальное значение на основе условия. Я получаю ошибку при попытке конвертировать значение Nan. category gender sub-category title health&beauty NaN makeup lipbalm health&beauty women makeup lipstick NaN ...

ТОП публикаций

3 ответа

) требуемый индекс

я есть датафрейм и я хочу удалить дубликаты строк, которые имеют одинаковые значения, но в разных столбцах: df = pd.DataFrame(columns=['a','b','c','d'], index=['1','2','3']) df.loc['1'] = pd.Series({'a':'x','b':'y','c':'e','d':'f'}) df.loc['2'] ...

1 ответ

@ cᴏʟᴅsᴘᴇᴇᴅ Насколько я знаю, поскольку это также может быть представлено одним массивом numpy, это не исключение, но я не могу быть уверен на 100%.

кументации сказано Numpy представление NDFrame -Источник [https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.values.html] Что означает «Numpy представление NDFrame»? Повлияет ли изменение этого пустого представления на мой ...

1 ответ

@TedPetrou, если ваш диапазон целых чисел известен и мал, вероятно, ничто не может побить ваш логический подход. Извините, я не заглядывал глубже в строковый регистр (он сложнее) В конце возможны различные компромиссы для реализации набора, и это зависит от данных, какой компромисс является «правильным». Однако полезно знать сильные и слабые стороны различных реализаций множеств.

аюсь найти наиболее эффективный метод, чтобы найти уникальные значения из массива NumPy. NumPy-хunique Функция очень медленная и сортирует значения в первую очередь, прежде чем находит уникальное. Панды хэшируют значения, используябиблиотека Clib ...

1 ответ

Хм, проблема в том, что это не столбец datetime, поэтому первый шаг - преобразование в datetime.

я есть датафрейм. Столбец содержит метки времени. Я хотел бы удалить даты и преобразовать время в секунды. Сначала я преобразовал их в datetime: In: df_time = pd.to_datetime(df["Timestamp"]) Out: 0 2017-11-07 13:09:00 1 2017-11-07 13:11:00 2 ...

1 ответ

 распечатывает цитируемое поле, и все работает нормально.

сь использоватьto_gbqдля обновления таблицы Google BigQuery я получаю ответ: GenericGBQException: Reason: 400 Error while reading data, error message: JSON table encountered too many errors, giving up. Rows: 1; errors: 1.Мой ...

2 ответа

Вам нужен новый пункт, чтобы помочь тогда

вая этот кадр данных: import pandas as pd a=pd.DataFrame({'number':[2,2,3],'A':['abc','def','ghi']}) a A number 0 abc 2 1 def 2 2 ghi 3Мне нужно объединить значения, в порядке индекса, из строк с одинаковым числовым значением, разделенных ...

3 ответа

С применением лямбда

ользую Pandas и пытаюсь создать новый столбец, используя оператор if-else Python (он же троичный оператор условия), чтобы избежать деления на ноль. Например, ниже, я хочу создать новый столбец C путем деления A / B. Я хочу использовать оператор ...