Результаты поиска по запросу "dataframe"
или просто сделайте:
я большой набор данных, и я хотел бы прочитать определенные столбцы или отбросить все остальные. data <- read.dta("file.dta")Я выбираю столбцы, которые мне не интересны: var.out <- names(data)[!names(data) %in% c("iden", "name", "x_serv", ...
@ Steve Если производительность важна, я согласен. Но все решения верны, поэтому используйте то, что вы предпочитаете, и то, что вам удобнее читать в долгосрочной перспективе.
я естьDataFrame ответов на 100questions_id и 50user_id«S. Каждая строка представляет отдельный вопрос от конкретного пользователя. Стол выглядит примерно так. user_id | question_id | timetaken | answer_1 | answer_2 | 1015 | 1 | 30 | A | C | 1015 ...
Да, иногда я это слишком усложнял. ;)
я есть этот фрейм данных, где ожидается, что пол будет мужской или женский. from io import StringIO import pandas as pd audit_trail = StringIO(''' course_id AcademicYear_to months TotalFee Gender 260 2017 24 100 male 260 2018 12 140 male 274 ...
группировать панды данных в два столбца (или больше)?
У меня есть следующий фрейм данных:
Применить функцию подмножества к списку фреймов данных
У меня есть списокSpatialPolygonDataFrame что я могу ассимилироваться сdataframe нравится: df.1 <- data.frame(A = c(1:10), B = c(1, 2, 2, 2, 5:10)) df.2 <- data.frame(A = c(1:10), B = c(1, 2, 2, 2, 2, 2, 7:10)) df.3 <- data.frame(A = c(1:10), B ...
r data.frame создать новую переменную
У меня есть датафрейм с 1,5 миллионами строк и 5 столбцами. Одна переменная (VARIABLE) имеет тип NATIONALITY_YEAR (например, SPAIN_1998), и я хочу разделить ее на два столбца, один из которых содержит национальность, которая является левой ...
(индексирование первого столбца). Так что это действительно решение с тремя линиями!
я есть файл с именемfinalscores.txt и я хочу создать скрипт Python, который будет открывать его и читать значения из двух отдельных столбцов. Это моеfinalscores.txt файл Atom nVa predppm avgppm stdev delta QPred QMulti qTotal 7.H2 2 7.674 7.853 ...
pandas - сводная таблица с нечисловыми значениями? (DataError: нет числовых типов для агрегирования)
Я пытаюсь сделать сводную таблицу, содержащую строки в качестве результатов. import pandas as pd df1 = pd.DataFrame({'index' : range(8), 'variable1' : ["A","A","B","B","A","B","B","A"], 'variable2' : ["a","b","a","b","a","b","a","b"], ...