Pandas: Wie ändere ich alle Werte einer Spalte?
Ich habe einen Datenrahmen mit einer Spalte namens"Date"
und möchten, dass alle Werte aus dieser Spalte denselben Wert haben (nur das Jahr). Beispiel:
City Date
Paris 01/04/2004
Lisbon 01/09/2004
Madrid 2004
Pekin 31/2004
Was ich will ist:
City Date
Paris 2004
Lisbon 2004
Madrid 2004
Pekin 2004
Hier ist mein Code:
fr61_70xls = pd.ExcelFile('AMADEUS FRANCE 1961-1970.xlsx')
#Here we import the individual sheets and clean the sheets
years=(['1961','1962','1963','1964','1965','1966','1967','1968','1969','1970'])
fr={}
header=(['City','Country','NACE','Cons','Last_year','Op_Rev_EUR_Last_avail_yr','BvD_Indep_Indic','GUO_Name','Legal_status','Date_of_incorporation','Legal_status_date'])
for year in years:
# save every sheet in variable fr['1961'], fr['1962'] and so on
fr[year]=fr61_70xls.parse(year,header=0,parse_cols=10)
fr[year].columns=header
# drop the entire Legal status date column
fr[year]=fr[year].drop(['Legal_status_date','Date_of_incorporation'],axis=1)
# drop every row where GUO Name is empty
fr[year]=fr[year].dropna(axis=0,how='all',subset=[['GUO_Name']])
fr[year]=fr[year].set_index(['GUO_Name','Date_of_incorporation'])
Es kommt vor, dass in meinen DataFrames zum Beispiel aufgerufen wirdfr['1961']
die Werte vonDate_of_incorporation
kann alles sein (Strings, Integer usw.), also ist es vielleicht am besten, diese Spalte vollständig zu löschen und dann eine weitere Spalte mit nur dem Jahr an die DataFrames anzuhängen?