Resultados da pesquisa a pedido "string-matching"

2 a resposta

etecção eficiente de sufixos de stri

Estou trabalhando com o PySpark em um enorme conjunto de dados, no qual desejo filtrar o quadro de dados com base nas seqüências de caracteres em outro quadro de dados. Por exemplo dd ...

1 a resposta

Unindo dois conjuntos de dados usando lógica difusa em R

Estou tentando fazer uma junção lógica difusa no R entre dois conjuntos de dados: O primeiro conjunto de dados tem o nome de um local e uma coluna chamadaconfigO segundo conjunto de dados tem o nome de um local e dois atributos adicionais ...

1 a resposta

Correspondência eficiente de strings no Apache Spark

Usando uma ferramenta de OCR, extraí textos de capturas de tela (cerca de 1 a 5 frases cada). No entanto, ao verificar manualmente o texto extraído, notei vários erros que ocorrem periodicamente. Dado o texto "Olá! Gosto muito do Spark ❤!", ...

2 a resposta

Correspondência de cadeia difusa R para retornar coluna específica com base na cadeia correspondente

Eu tenho dois grandes conjuntos de dados, um em torno de meio milhão de registros e o outro em torno de 70K. Esses conjuntos de dados têm endereço. Quero corresponder se algum endereço no conjunto de dados menor estiver presente no endereço ...

1 a resposta

R Correspondência de string para o endereço usando stringdist, stringdistmatrix

Eu tenho dois grandes conjuntos de dados, um em torno de meio milhão de registros e o outro em torno de 70K. Esses conjuntos de dados têm endereço. Quero corresponder se algum endereço no conjunto de dados menor estiver presente no endereço ...

3 a resposta

encontre linhas de um arquivo em outro

Então, eu tenho um arquivo1.txt com uma lista de nomes e um arquivo2.txt com outra lista de nomes e preciso de uma lista com os nomes que estão nos dois arquivos. eu tenteigrep-f file1.txt file2.txt > newlist.txt mas, por algum motivo, não está ...

2 a resposta

Encontre cadeias correspondentes entre dois vetores em R

Eu tenho dois vetores em R. Eu quero encontrar correspondências parciais entre eles. Meus dadosO primeiro é de um conjunto de dados chamado muc, que contém 6400 nomes de ruas. muc $ name se parece com: muc$name = c("Berberichweg", ...

5 a resposta

Uma das seqüências de caracteres na matriz para corresponder a uma expressão

O problema: Eu tenho uma série de promessas que são resolvidas para ummatriz de cordas. Agora o teste deve passar se pelo menos uma das seqüências corresponder a uma expressão regular. Atualmente, eu resolvo isso usando concatenação de string ...

4 a resposta

Remova as extremidades das entradas de sequência na coluna DataFrame do pandas

Eu tenho um Dataframe pandas com uma coluna uma lista de arquivos import pandas as pd df = pd.read_csv('fname.csv') df.head() filename A B C fn1.txt 2 4 5 fn2.txt 1 2 1 fn3.txt .... ....Eu gostaria de excluir a extensão do arquivo.txt de cada ...

2 a resposta

verifique se todos os caracteres de uma string existem em outra string em r

Estou tentando comparar seqüências de caracteres comoPRABHAKAR SHARMA eSHARMA KUMAR PRABHAKAR. a intenção é verificar se todos os caracteres da cadeia mais curta existem na outra cadeia. Se for esse o caso, devo obter uma correspondência de 100%, ...