Geografische Standorte im Text identifizieren

Question

Jul 29, 2009, 05:08 PM

Geografische Standorte im Text identifizieren

Welche Art von Arbeit wurde geleistet, um festzustellen, ob eine bestimmte Zeichenfolge zu einem geografischen Ort gehört? Zum Beispiel:

'troy, ny'
'austin, texas'
'hotels in las vegas, nv'

Ich vermute, ich erwarte einen statistischen Ansatz, der ein gewisses Maß an Sicherheit gibt, dass die ersten beiden Orte sind. Die letzte würde wahrscheinlich eine Heuristik erfordern, die "% s,% s" erfasst und dann dieselbe Technik verwendet. Ich suche speziell nach Ansätzen, die sich nicht zu stark auf die Aussage 'in' stützen, da es sich nicht um einen völlig eindeutigen oder konsistent verfügbaren Standortindikator handelt.

Kann jemand mich auf Ansätze, Papiere oder vorhandene Dienstprogramme hinweisen? Vielen Dank!