Resultados da pesquisa a pedido "string-matching"
Obtendo um intervalo de caracteres ilegal na regex: java
Eu tenho um padrão de regex simples que verifica nomes. Mas quando eu o executo, recebo um erro de intervalo de caracteres ilegal. Eu pensei em escapar "...
Como substituir todos os caracteres correspondentes, exceto a primeira ocorrência
Estou tentando usar regex para comparar uma seqüência de caracteres em JavaScript. Eu quero substituir tudo'.'s e'%'s com caractere vazio '', mas o problema é que não quero substituir a primeira ocorrência de'.'. value.replace(/\%\./g, ...
R Correspondência de string para o endereço usando stringdist, stringdistmatrix
Eu tenho dois grandes conjuntos de dados, um em torno de meio milhão de registros e o outro em torno de 70K. Esses conjuntos de dados têm endereço. Quero corresponder se algum endereço no conjunto de dados menor estiver presente no endereço ...
Correspondência eficiente de strings no Apache Spark
Usando uma ferramenta de OCR, extraí textos de capturas de tela (cerca de 1 a 5 frases cada). No entanto, ao verificar manualmente o texto extraído, notei vários erros que ocorrem periodicamente. Dado o texto "Olá! Gosto muito do Spark ❤!", ...
Unindo dois conjuntos de dados usando lógica difusa em R
Estou tentando fazer uma junção lógica difusa no R entre dois conjuntos de dados: O primeiro conjunto de dados tem o nome de um local e uma coluna chamadaconfigO segundo conjunto de dados tem o nome de um local e dois atributos adicionais ...
Hashing n-gramas por polinômios cíclicos - implementação em java
Estou resolvendo um problema que envolve o algoritmo de busca de cordas Rabin-Karp. Esse algoritmo exige que o hash de rolagem seja mais rápido que a pesquisa ingênua.Este artigo [http://en.wikipedia.org/wiki/Rolling_hash]descreve como ...
Crie um ID exclusivo por correspondência fuzzy de nomes (via agrep usando R)
Usando R, estou tentando combinar os nomes das pessoas em um conjunto de dados estruturado por ano e cidade. Devido a alguns erros de ortografia, a correspon...
Como selecionar as linhas R data.table com base na correspondência de substring (como o SQL)
Eu tenho um data.table com uma coluna de caractere, e quero selecionar apenas as linhas que contêm uma substring nele. Equivalente ao SQL