Какие проверенные и действительные алгоритмы для предложения связанных статей существуют?

Довольно распространенная ситуация, я готов поспорить. У вас есть блог или новостной сайт, и у вас есть множество статей или блогов, или как вы их называете, и вы хотите, в нижней части каждого, предложить другие, которые кажутся связанными.

Давайте предположим, что очень мало метаданных о каждом элементе. То есть без тегов, категорий. Рассматривайте как один большой фрагмент текста, включая заголовок и имя автора.

Как вы можете найти возможные документы?

Я скорее заинтересован в реальном алгоритме, а не в готовых решениях, хотя я вполне мог бы взглянуть на что-то реализованное в ruby или python или полагаться на mysql или pgsql.

edit: текущий ответ довольно хороший, но я хотел бы увидеть больше. Может быть, какой-то действительно чистый пример кода для вещи или двух.

Ответы на вопрос(5)

Ваш ответ на вопрос