Результаты поиска по запросу "search-engine"

1 ответ

Lucene: Как выполнить поиск по нескольким независимым наборам индексов и объединить результат?

0 ответов

Google может использовать и другие входные параметры, кроме локали / принятых языков. Это включает в себя информацию куки, а также другие метаданные браузера, которые отсутствуют в запросе API.

аю, что вопрос в значительной степени подводит итог моего запроса.

1 ответ

Спасибо - попробую сегодня с этим поработать.

тоящее время я работаю сLucene.net 2.9.2 [http://incubator.apache.org/lucene.net/]фреймворк. В результате моего поиска я хотел бы получить страницу результатов (asp.net) с выделенным фрагментом текста. Я хотел бы, чтобы выбранный фрагментцелое ...

ТОП публикаций

2 ответа

Ищите уникальный шаблон идентификатора, который легко индексируется поисковыми системами

Как от Microsoft -"KB2756872" или из Национальной базы данных уязвимостей -"CVE-2010-1428" или из Red Hat -"RHSA-2010: 0376" или из OID -"1.3.6.1.4.1.311" или из UUID / GUID -"550e8400-e29b-41d4-a716-446655440000". Я хочу поставить несколько ...

3 ответа

Как было упомянуто Эриксоном в Lucene, термин «частотно-обратная частота документа» (TF-IDF) подобен косинусному подобию. Представьте, что у вас есть две сумки терминов в запросе и в документе. Это измерение точно соответствует только терминам, а после в контекст включается их семантически весовые коэффициенты. Термины с очень частым вхождением имеют меньший вес (важность), потому что вы можете найти их в большом количестве документов. Но серьезная проблема заключается в том, что косинусное сходство TF-IDF не столь устойчиво для более противоречивых данных, когда вам нужно вычислить сходство между запросом и документом, более надежным, например. опечатки, опечатки и фонетические ошибки. Потому что слова должны иметь точное совпадение.

аете, где я могу найти объяснение высокого уровняКласс сходства Lucene [http://lucene.apache.org/java/2_2_0/api/org/apache/lucene/search/Similarity.html] алгоритм. Я хотел бы понять это без необходимости расшифровывать все математические и ...

2 ответа

Ищите уникальный шаблон идентификатора, который легко индексируется поисковыми системами

Как от Microsoft - "KB2756872" или из Национальной базы данных уязвимостей - "CVE-2010-1428" или из Red Hat - "RHSA-2010: 0376"...

9 ответов

Измените URL, чтобы сканировать больше сайтов ...... удачи

лкивался с вопросом на собеседовании «Если бы вы разрабатывали веб-сканер, как бы вы не попали в бесконечные циклы?», И я пытаюсь на него ответить. Как все это начинается с самого начала. Скажем, Google начал с некоторых хаб-страниц, скажем, ...

1 ответ

как настроить synonyms_path вasticsearch

Я довольно новичок вasticsearch, и я хочу использовать синонимы, я добавил эти строки в файл конфигурации:

2 ответа

Что Percolator означает / делает в эластичном поиске?

5 ответов

Интернационализация и поисковая оптимизация

Я хотел бы интернационализировать свой сайт так, чтобы он был доступен на многих языках. Настройка языка будет обнаружена в данных запроса автоматически и может быть переопределена в настройках пользователя / сохранена в сеансе. Мой вопрос ...