Создать Pandas DataFrame из текстового файла с определенным шаблоном
Мне нужно создать DataFrame Pandas на основе текстового файла на основе следующей структуры:
Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
Livingston (University of West Alabama)[2]
Montevallo (University of Montevallo)[2]
Troy (Troy University)[2]
Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4]
Tuskegee (Tuskegee University)[5]
Alaska[edit]
Fairbanks (University of Alaska Fairbanks)[2]
Arizona[edit]
Flagstaff (Northern Arizona University)[6]
Tempe (Arizona State University)
Tucson (University of Arizona)
Arkansas[edit]
Строки с «[edit]» являются состояниями, а строки [number] являются областями. Мне нужно разделить следующее и повторить название штата для каждого названия региона после этого.
Index State Region Name
0 Alabama Aurburn...
1 Alabama Florence...
2 Alabama Jacksonville...
...
9 Alaska Fairbanks...
10 Alaska Arizona...
11 Alaska Flagstaff...
Панды DataFrame
Я не уверен, как разбить текстовый файл на основе «[edit]» и «[number]» или «(символов)» на соответствующие столбцы и повторить имя штата для каждого имени региона. Пожалуйста, кто-нибудь может дать мне отправную точку для выполнения следующих действий.