Я предполагаю, что они используют ту же логику, что и GoogleBot. Абзац под тегом H1, ближайший к верхнему левому углу сайта, получает наибольший вес.
имаюсь разработкой приложения, которое может публиковать контент, например, какой-то канал. Я хочу добавить контент в виде ссылки (как на стене Facebook).
Затем я хочу немного логики, чтобы проанализировать назначение ссылки и извлечь правильный текст и изображение, чтобы создать миниатюру.
Так же, как это делает Facebook, когда вы публикуете ссылку на своей стене.
Механизм извлечения / обхода кажется довольно сложным, но как лучше всего подойти к этому?
Я думал о том, чтобы обойти API-интерфейсы Facebook и «потом и потом вернуть» элемент из Facebook, и таким образом просто использовать их движок, но я действительно хотел бы сделать это как внутреннюю систему.