Resultados da pesquisa a pedido "fuzzywuzzy"

2 a resposta

Quando usar qual função fuzz para comparar 2 strings

Estou aprendendo fuzzywuzzy em python, entendo o conceito de fuzz.ratio, fuzz.partial_ratio, fuzz.token_sort_ratio e fuzz.token_set_ratio. Minha pergunta é quando usar qual função? Verifico primeiro o comprimento das duas cordas, digo se não for ...

1 a resposta

Aplique a correspondência difusa em uma coluna do quadro de dados e salve os resultados em uma nova coluna

Eu tenho dois quadros de dados, cada um com um número diferente de linhas. Abaixo estão algumas linhas de cada conjunto de dados df1 = Company City State ZIP FREDDIE LEES AMERICAN GOURMET SAUCE St. Louis MO 63101 CITYARCHRIVER 2015 FOUNDATION ...

1 a resposta

pesquisa difusa entre 2 séries / df.columns

Com base neste link, eu estava tentando fazer uma pesquisa difusa:Aplique a correspondência difusa em uma coluna do quadro de dados e salve os resultados em uma nova ...

2 a resposta

Seqüência de erros ou buffer de erro fuzzywuzzy do Python

Estou usando o fuzzywuzzy para encontrar correspondências próximas em um csv de nomes de empresas. Estou comparando cadeias correspondidas manualmente com cadeias sem correspondência na esperança de encontrar algumas correspondências de ...

1 a resposta

O que significa "os seguintes pacotes serão substituídos por um canal de maior prioridade" significa?

Disclaimer: Eu sou um ignorante Linux + Anaconda noob. Agora, com isso fora do caminho: estou tentando instalar o fuzzywuzzy na minha distribuição Anaconda no Linux de 64 bits. Quando faço isso, ele tenta mudar minhacondaeconda-env ...

2 a resposta

Python Pandas fuzzy merge / match com duplicatas

2 a resposta

como paralelizar muitas comparações de strings (nebulosas) usando apply no Pandas?

Eu tenho o seguinte problema Eu tenho um quadro de dadosmestreque contém frases, como master Out[8]: original 0 this is a nice sentence 1 this is another one 2 stackoverflow is nicePara cada linha no Master, procuro outro Dataframeescravopara a ...

3 a resposta

Correspondência difusa do Python (FuzzyWuzzy) - Mantenha apenas a melhor correspondência

Estou tentando fazer a correspondência difusa de dois arquivos csv, cada um contendo uma coluna de nomes, que são semelhantes, mas não iguais. Meu código até agora é o seguinte: import pandas as pd from pandas import DataFrame from fuzzywuzzy ...

1 a resposta

crie uma nova coluna no dataframe usando fuzzywuzzy

Eu tenho um quadro de dados empandas onde eu estou usandofuzzywuzzy pacote em python para combinar a primeira coluna no quadro de dados com a segunda coluna. Eu defini uma função para criar uma saída com a primeira coluna, a segunda coluna e a ...

1 a resposta

correspondência difusa em R

Estou tentando detectar correspondências entre um campo de texto aberto (leia-se: bagunçado!) Com um vetor de nomes. Criei um exemplo bobo de frutas que destaca meus principais desafios. df1 <- data.frame(id = c(1, 2, 3, 4, 5, 6), entry = ...