Результаты поиска по запросу "information-retrieval"

3 ответа

Реализации TF-IDF в Python

Какие стандартные реализации tf-idf / api доступны в python? Я сталкивался с одним в NLTK. Я хочу знать другие библиотеки, которые предоставляют эту функцию.

1 ответ

@berkin Спасибо за ваш ответ. Счастливого обучения!

я есть словарь, содержащий слова и частоту каждого слова. {'cxampphtdocsemployeesphp': 1, 'emptiness': 1, 'encodingundefinedconversionerror': 1, 'msbuildexe': 2, 'e5': 1, 'lnk4049': 1, 'specifierqualifierlist': 2, .... }Теперь я хочу создать ...

4 ответа

@ user757256: да, Jython немного медленнее и требует больше памяти. Взломайте какой-нибудь прототип, сравните с CPython и Jython, а затем посмотрите, что вы можете оптимизировать. И снова сделайте свой выбор только после оценки, какие библиотеки вы можете использовать.

ро начну новый проект, в котором собираюсь выполнять множество задач по обработке текста, таких как поиск, категоризация / классификация, кластеризация и так далее. Там будет огромное количество документов, которые должны быть ...

ТОП публикаций

5 ответов

Powerset, приобретенный Microsoft, также пытается ответить на вопрос. Они называют свой продукт «поисковой системой на естественном языке», где вы можете ввести такой вопрос, как «В каком штате США самый высокий подоходный налог?» и искать по вопросу вместо использования ключевых слов.

орое время я размышлял об этом, и я не понимаю, почему Google еще не пробовал - или, может быть, они пробовали, и я просто не знаю об этом. Есть ли поисковая система, в которую вы можете ввести вопрос, в который вы получите один ответ, а не ...

2 ответа

Скрипт Python для поиска частот слов данного документа

Я ищу простой скрипт, который может найти частоты слов для данного документа (возможно, с помощью переносного стеммера). Есть ли библиотека или простой скрипт, который делает этот процесс?

3 ответа

Как разобрать данные из Google Alerts?

Во-первых, как вы будете получать информацию о Google Alerts в базу данных, кроме анализа текста сообщения электронной почты, которое вам отправляет Google? Похоже, что нет Google Alerts API. Если вам нужно разобрать текст, как бы вы пошли в ...

2 ответа

Есть ли лучший способ найти пересечение набора для кода поисковой системы?

Я кодировал небольшую поисковую систему и должен выяснить, есть ли более быстрый способ найти множество пересечений. В настоящее время я использую отсортированный связанный список, как описано в большинстве алгоритмов поисковых систем. Т.е. для ...

1 ответ

Расчет получения информации для текстового файла?

Я работаю на«классификация текста с использованием получения информации, PCA и генетического алгоритма»Но после выполненияпредварительная обработка(Стеблинг, удаление стоп-слов, TFIDF) на документе, я не понимал, как двигаться дальше ...

1 ответ

Facebook График поиска: алгоритм поиска информации

Есть закрытый вопрос под названием "Как работает поиск по графику в Facebook? [https://stackoverflow.com/questions/14498507/how-does-facebook-graph-search-work] " Проще говоря, ОП спросил (и даже дал пример того, что он пытался): Как работает ...

1 ответ

Система поиска изображений по цвету из Интернета с использованием C ++ с openframeworks

Я пишу программу на C ++ и openFrameworks, которая, как мы надеемся, должна реализовать систему поиска изображений путем сопоставления цветов. У меня есть алгоритм, чтобы найти совпадение в базе данных по значению RGB. Например, если у меня есть ...