Определение географического положения в тексте
Какого рода работа была проделана, чтобы определить, относится ли конкретная строка к географическому местоположению? Например:
'troy, ny'
'austin, texas'
'hotels in las vegas, nv'
Полагаю, что я ожидаю увидеть статистический подход, который дает определенную степень уверенности в том, что первые два являются местоположениями. Последнее, вероятно, потребует эвристики, которая захватывает «% s,% s». а затем использует ту же технику. Я конкретно ищу подходы, которые не слишком сильно зависят от предложения в, так как он не является полностью однозначным или постоянно доступным индикатором местоположения.
Может ли кто-нибудь указать мне подходы, документы или существующие утилиты? Спасибо!