Создать Pandas DataFrame из текстового файла с определенным шаблоном

Question

Dec 29, 2016, 09:02 PM

Создать Pandas DataFrame из текстового файла с определенным шаблоном

Мне нужно создать DataFrame Pandas на основе текстового файла на основе следующей структуры:

Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
Livingston (University of West Alabama)[2]
Montevallo (University of Montevallo)[2]
Troy (Troy University)[2]
Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4]
Tuskegee (Tuskegee University)[5]
Alaska[edit]
Fairbanks (University of Alaska Fairbanks)[2]
Arizona[edit]
Flagstaff (Northern Arizona University)[6]
Tempe (Arizona State University)
Tucson (University of Arizona)
Arkansas[edit]

Строки с «[edit]» являются состояниями, а строки [number] являются областями. Мне нужно разделить следующее и повторить название штата для каждого названия региона после этого.

Index          State          Region Name
0              Alabama        Aurburn...
1              Alabama        Florence...
2              Alabama        Jacksonville...
...
9              Alaska         Fairbanks...
10             Alaska         Arizona...
11             Alaska         Flagstaff...

Панды DataFrame

Я не уверен, как разбить текстовый файл на основе «[edit]» и «[number]» или «(символов)» на соответствующие столбцы и повторить имя штата для каждого имени региона. Пожалуйста, кто-нибудь может дать мне отправную точку для выполнения следующих действий.

Создать Pandas DataFrame из текстового файла с определенным шаблоном

Ответы на вопрос(5)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Создать Pandas DataFrame из текстового файла с определенным шаблоном

Ответы на вопрос(5)

Ваш ответ на вопрос

Популярные вопросы