Результаты поиска по запросу "search-engine"
Измените URL, чтобы сканировать больше сайтов ...... удачи
лкивался с вопросом на собеседовании «Если бы вы разрабатывали веб-сканер, как бы вы не попали в бесконечные циклы?», И я пытаюсь на него ответить. Как все это начинается с самого начала. Скажем, Google начал с некоторых хаб-страниц, скажем, ...
Elasticsearch основан на Lucene, однако, это означает, что на самом деле это не альтернатива, а скорее оболочка / расширение.
жет работать в Unix и будет использоваться для поиска по электронной почте (Dovecot, Postfix и maildir). Lucene не проблема, я просто анализирую некоторые альтернативы.
Класс 'ZendSearch \ Lucene \ Lucene' не найден ZendFramework2
Я установил ZendSearch с composer, используя эти команды: $ cd /var/www/CommunicationApp/vendor/ $ git clone https://github.com/zendframework/ZendSearch.git ZendSearch $ cd ZendSearch/ $ curl -s https://getcomposer.org/installer | php $ php ...
Поскольку вопрос был о взаимодействии между сервером и клиентами, кажется разумным предположить, что речь идет о перенаправлении HTTP. Внутренний редирект, который никоим образом не предоставляется клиенту, не будет иметь значения.
ользую cms, и ошибки, связанные с отсутствием файла, могут быть обработаны различными способами: Страница не будет перенаправлена, но сообщение об ошибке будет отображаться как контент (используя макет по умолчанию с меню / нижним ...
Методы предотвращения индексации поисковыми системами ненужного контента на странице
Я ищу способы предотвратить индексацию частей страницы. В частности, комментарии на странице, поскольку они много взвешивают записи на основе того, что написали пользователи. Это заставляет поиск Google на странице возвращать много не относящихся ...
Почему сканеры поисковых систем не запускают JavaScript? [закрыто]
Я работал с некоторыми продвинутыми приложениями javascript, используя много запросов ajax для отображения моей страницы. Чтобы приложения могли сканироваться (от Google), я должен ...
Google может использовать и другие входные параметры, кроме локали / принятых языков. Это включает в себя информацию куки, а также другие метаданные браузера, которые отсутствуют в запросе API.
аю, что вопрос в значительной степени подводит итог моего запроса.
Как было упомянуто Эриксоном в Lucene, термин «частотно-обратная частота документа» (TF-IDF) подобен косинусному подобию. Представьте, что у вас есть две сумки терминов в запросе и в документе. Это измерение точно соответствует только терминам, а после в контекст включается их семантически весовые коэффициенты. Термины с очень частым вхождением имеют меньший вес (важность), потому что вы можете найти их в большом количестве документов. Но серьезная проблема заключается в том, что косинусное сходство TF-IDF не столь устойчиво для более противоречивых данных, когда вам нужно вычислить сходство между запросом и документом, более надежным, например. опечатки, опечатки и фонетические ошибки. Потому что слова должны иметь точное совпадение.
аете, где я могу найти объяснение высокого уровняКласс сходства Lucene [http://lucene.apache.org/java/2_2_0/api/org/apache/lucene/search/Similarity.html] алгоритм. Я хотел бы понять это без необходимости расшифровывать все математические и ...
Powerset, приобретенный Microsoft, также пытается ответить на вопрос. Они называют свой продукт «поисковой системой на естественном языке», где вы можете ввести такой вопрос, как «В каком штате США самый высокий подоходный налог?» и искать по вопросу вместо использования ключевых слов.
орое время я размышлял об этом, и я не понимаю, почему Google еще не пробовал - или, может быть, они пробовали, и я просто не знаю об этом. Есть ли поисковая система, в которую вы можете ввести вопрос, в который вы получите один ответ, а не ...
Как какой-то сайт с поддельными ссылками отображается в результатах поиска
В эти дни я сталкиваюсь с несколькими результатами поиска Google, которые содержат сайты со ссылками, которые точно соответствуют моим поисковым словам. Как сайты могут динамически изменять свое содержание, или, скорее, они дурачат Google, чтобы ...