Resultados da pesquisa a pedido "string-matching"
etecção eficiente de sufixos de stri
Estou trabalhando com o PySpark em um enorme conjunto de dados, no qual desejo filtrar o quadro de dados com base nas seqüências de caracteres em outro quadro de dados. Por exemplo dd ...
Unindo dois conjuntos de dados usando lógica difusa em R
Estou tentando fazer uma junção lógica difusa no R entre dois conjuntos de dados: O primeiro conjunto de dados tem o nome de um local e uma coluna chamadaconfigO segundo conjunto de dados tem o nome de um local e dois atributos adicionais ...
Correspondência eficiente de strings no Apache Spark
Usando uma ferramenta de OCR, extraí textos de capturas de tela (cerca de 1 a 5 frases cada). No entanto, ao verificar manualmente o texto extraído, notei vários erros que ocorrem periodicamente. Dado o texto "Olá! Gosto muito do Spark ❤!", ...
Correspondência de cadeia difusa R para retornar coluna específica com base na cadeia correspondente
Eu tenho dois grandes conjuntos de dados, um em torno de meio milhão de registros e o outro em torno de 70K. Esses conjuntos de dados têm endereço. Quero corresponder se algum endereço no conjunto de dados menor estiver presente no endereço ...
R Correspondência de string para o endereço usando stringdist, stringdistmatrix
Eu tenho dois grandes conjuntos de dados, um em torno de meio milhão de registros e o outro em torno de 70K. Esses conjuntos de dados têm endereço. Quero corresponder se algum endereço no conjunto de dados menor estiver presente no endereço ...
encontre linhas de um arquivo em outro
Então, eu tenho um arquivo1.txt com uma lista de nomes e um arquivo2.txt com outra lista de nomes e preciso de uma lista com os nomes que estão nos dois arquivos. eu tenteigrep-f file1.txt file2.txt > newlist.txt mas, por algum motivo, não está ...
Encontre cadeias correspondentes entre dois vetores em R
Eu tenho dois vetores em R. Eu quero encontrar correspondências parciais entre eles. Meus dadosO primeiro é de um conjunto de dados chamado muc, que contém 6400 nomes de ruas. muc $ name se parece com: muc$name = c("Berberichweg", ...
Uma das seqüências de caracteres na matriz para corresponder a uma expressão
O problema: Eu tenho uma série de promessas que são resolvidas para ummatriz de cordas. Agora o teste deve passar se pelo menos uma das seqüências corresponder a uma expressão regular. Atualmente, eu resolvo isso usando concatenação de string ...
Remova as extremidades das entradas de sequência na coluna DataFrame do pandas
Eu tenho um Dataframe pandas com uma coluna uma lista de arquivos import pandas as pd df = pd.read_csv('fname.csv') df.head() filename A B C fn1.txt 2 4 5 fn2.txt 1 2 1 fn3.txt .... ....Eu gostaria de excluir a extensão do arquivo.txt de cada ...
verifique se todos os caracteres de uma string existem em outra string em r
Estou tentando comparar seqüências de caracteres comoPRABHAKAR SHARMA eSHARMA KUMAR PRABHAKAR. a intenção é verificar se todos os caracteres da cadeia mais curta existem na outra cadeia. Se for esse o caso, devo obter uma correspondência de 100%, ...