COUNTIF в pandas python для нескольких столбцов с несколькими условиями
У меня есть набор данных, в котором я пытаюсь определить количество факторов риска на человека. Итак, у меня есть следующие данные:
Person_ID Age Smoker Diabetes
001 30 Y N
002 45 N N
003 27 N Y
004 18 Y Y
005 55 Y Y
Каждый атрибут (возраст, курильщик, диабет) имеет свое собственное условие, чтобы определить, является ли он фактором риска. Так что если возраст> = 45, это фактор риска. Курильщик и диабет являются факторами риска, если они обозначены как «Y» Я хотел бы добавить столбец, который суммирует количество факторов риска для каждого человека на основе этих условий. Таким образом, данные будут выглядеть так:
Person_ID Age Smoker Diabetes Risk_Factors
001 30 Y N 1
002 25 N N 0
003 27 N Y 1
004 18 Y Y 2
005 55 Y Y 3
У меня есть примерный набор данных, с которым я дурачился в Excel, и способ, которым я это сделал, заключался в использовании формулы COUNTIF следующим образом:
=COUNTIF(B2,">45") + COUNTIF(C2,"=Y") + COUNTIF(D2,"=Y")
Однако фактический набор данных, который я буду использовать, слишком велик для Excel, поэтому я изучаю панды для python. Хотелось бы привести примеры того, что я уже пробовал, но, честно говоря, я даже не знаю, с чего начать. я смотрел наэтот вопрос, но в действительности это не касается того, что делать с применением его ко всему новому столбцу, используя различные условия из нескольких столбцов. Какие-либо предложения?