Wyodrębnianie hiperłączy z Excela (.xlsx) za pomocą Pythona
Przeglądałem głównie biblioteki xlrd i openpyxl do manipulacji plikami Excel. Jednak xlrd obecnie nie obsługujeformatting_info=True
dla plików .xlsx, więc nie mogę używać xlrdhyperlink_map
funkcjonować. Więc zwróciłem się do openpyxl, ale nie miałem też szczęścia wyodrębnić z niego hiperłącza z pliku Excela. Kod testowy poniżej (plik testowy zawiera proste hiperłącze do google z tekstem hiperłącza ustawionym na „test”):
import openpyxl
wb = openpyxl.load_workbook('testFile.xlsx')
ws = wb.get_sheet_by_name('Sheet1')
r = 0
c = 0
print ws.cell(row = r, column = c). value
print ws.cell(row = r, column = c). hyperlink
print ws.cell(row = r, column = c). hyperlink_rel_id
Wydajność:
test
None
Myślę, że openpyxl też nie obsługuje jeszcze formatowania? Czy istnieje inna biblioteka, której mogę użyć do wyodrębnienia informacji o hiperłączach z plików programu Excel (.xlsx)?