Como combinar texto em uma célula para regex e manter apenas o texto que corresponde a regex?
O que estou tentando fazer: Há uma grande planilha do Excel com muitas informações aleatórias do cliente. Quero classificar o endereço de e-mail e outros dados em um formato definido em um novo arquivo do Excel.
Não consigo descobrir como combinar o texto da célula (que terá algum formato, como o email de endereço compactado e similares) com a regex e manter apenas os dados da regex em uma lista.
Realmente apreciaria alguma ajuda. obrigado
import sys, os, openpyxl
def sort_email_from_xl():
sheet = sheet_select() #Opens the worksheet
emailRegex = re.compile(r'''([a-zA-Z0-9._%+-]+@+[a-zA-Z0-9.-]+(\.[a-zA-Z]{2,4}))''',re.VERBOSE)
customeremails = []
for row in range(0, max_row):
if cell.text == emailRegex:
mail = cell.text
customeremails.append(mail)
return customeremails
print(customeremails)