Resultados da pesquisa a pedido "fuzzywuzzy"
Quando usar qual função fuzz para comparar 2 strings
Estou aprendendo fuzzywuzzy em python, entendo o conceito de fuzz.ratio, fuzz.partial_ratio, fuzz.token_sort_ratio e fuzz.token_set_ratio. Minha pergunta é quando usar qual função? Verifico primeiro o comprimento das duas cordas, digo se não for ...
Aplique a correspondência difusa em uma coluna do quadro de dados e salve os resultados em uma nova coluna
Eu tenho dois quadros de dados, cada um com um número diferente de linhas. Abaixo estão algumas linhas de cada conjunto de dados df1 = Company City State ZIP FREDDIE LEES AMERICAN GOURMET SAUCE St. Louis MO 63101 CITYARCHRIVER 2015 FOUNDATION ...
pesquisa difusa entre 2 séries / df.columns
Com base neste link, eu estava tentando fazer uma pesquisa difusa:Aplique a correspondência difusa em uma coluna do quadro de dados e salve os resultados em uma nova ...
Seqüência de erros ou buffer de erro fuzzywuzzy do Python
Estou usando o fuzzywuzzy para encontrar correspondências próximas em um csv de nomes de empresas. Estou comparando cadeias correspondidas manualmente com cadeias sem correspondência na esperança de encontrar algumas correspondências de ...
O que significa "os seguintes pacotes serão substituídos por um canal de maior prioridade" significa?
Disclaimer: Eu sou um ignorante Linux + Anaconda noob. Agora, com isso fora do caminho: estou tentando instalar o fuzzywuzzy na minha distribuição Anaconda no Linux de 64 bits. Quando faço isso, ele tenta mudar minhacondaeconda-env ...
como paralelizar muitas comparações de strings (nebulosas) usando apply no Pandas?
Eu tenho o seguinte problema Eu tenho um quadro de dadosmestreque contém frases, como master Out[8]: original 0 this is a nice sentence 1 this is another one 2 stackoverflow is nicePara cada linha no Master, procuro outro Dataframeescravopara a ...
Correspondência difusa do Python (FuzzyWuzzy) - Mantenha apenas a melhor correspondência
Estou tentando fazer a correspondência difusa de dois arquivos csv, cada um contendo uma coluna de nomes, que são semelhantes, mas não iguais. Meu código até agora é o seguinte: import pandas as pd from pandas import DataFrame from fuzzywuzzy ...
crie uma nova coluna no dataframe usando fuzzywuzzy
Eu tenho um quadro de dados empandas onde eu estou usandofuzzywuzzy pacote em python para combinar a primeira coluna no quadro de dados com a segunda coluna. Eu defini uma função para criar uma saída com a primeira coluna, a segunda coluna e a ...
correspondência difusa em R
Estou tentando detectar correspondências entre um campo de texto aberto (leia-se: bagunçado!) Com um vetor de nomes. Criei um exemplo bobo de frutas que destaca meus principais desafios. df1 <- data.frame(id = c(1, 2, 3, 4, 5, 6), entry = ...
Página 1 do 2