Suchergebnisse für Anfrage "fuzzywuzzy"

2 die antwort

Fuzzy-Matching auf eine Datenrahmenspalte anwenden und Ergebnisse in einer neuen Spalte speichern

Ich habe zwei Datenrahmen mit jeweils einer unterschiedlichen Anzahl von Zeilen. Unten finden Sie ein paar Zeilen aus jedem Datensatz df1 = Company City State ZIP FREDDIE LEES AMERICAN GOURMET SAUCE St. Louis MO 63101 CITYARCHRIVER 2015 ...

6 die antwort

Python Fuzzy Matching (FuzzyWuzzy) - Behalte nur die beste Übereinstimmung

Ich versuche, zwei CSV-Dateien, die jeweils eine Spalte mit Namen enthalten, mit Fuzzy-Übereinstimmungen abzugleichen, die ähnlich, aber nicht identisch sind. Mein Code ist bis jetzt wie folgt: import pandas as pd from pandas import DataFrame ...

4 die antwort

Python fuzzywuzzy Fehlerzeichenfolge oder Puffer erwarten

Ich verwende fuzzywuzzy, um nahe Übereinstimmungen in einer CSV-Datei mit Firmennamen zu finden. Ich vergleiche manuell übereinstimmende Zeichenfolgen mit nicht übereinstimmenden Zeichenfolgen in der Hoffnung, einige nützliche Übereinstimmungen ...

TOP-Veröffentlichungen

2 die antwort

Erstelle eine neue Spalte im Datenrahmen mit fuzzywuzzy

Ich habe einen Datenrahmen inpandas Wo verwende ichfuzzywuzzy Paket in Python, um die erste Spalte des Datenrahmens mit der zweiten Spalte abzugleichen. Ich habe eine Funktion definiert, um eine Ausgabe mit der ersten Spalte, der zweiten Spalte ...

4 die antwort

wie kann man viele (Fuzzy-) Zeichenkettenvergleiche mit apply in Pandas parallelisieren?

Ich habe das folgende Problem Ich habe einen DatenrahmenMeiste das Sätze enthält, wie zB master Out[8]: original 0 this is a nice sentence 1 this is another one 2 stackoverflow is niceFür jede Zeile im Master schaue ich in einem ...

4 die antwort

Wenn welche Fuzz-Funktion zum Vergleichen von 2 Strings verwendet werden soll

Ich lerne Fuzzywuzzy in Python, verstehe das Konzept von fuzz.ratio, fuzz.partial_ratio, fuzz.token_sort_ratio und fuzz.token_set_ratio. Meine Frage ist, wann welche Funktion verwendet werden soll? Überprüfe ich zuerst die Länge der 2 ...

2 die antwort

Python Pandas Fuzzy Merge / Match mit Duplikaten

Ich habe derzeit 2 Datenrahmen, einen für Spender und einen für Spendenaktionen. Im Idealfall versuche ich herauszufinden, ob auch Spender Spenden geleistet ...

6 die antwort

Fuzzy String Matching in Python

Ich habe 2 Listen mit über einer Million Namen mit leicht abweichenden Namenskonventionen. Das Ziel hier ist es, die Datensätze, die ähnlich sind, mit der Logik von 95% Vertrauen abzugleichen. Mir wurde bewusst, dass es Bibliotheken gibt, auf ...