Я предполагаю, что они используют ту же логику, что и GoogleBot. Абзац под тегом H1, ближайший к верхнему левому углу сайта, получает наибольший вес.

имаюсь разработкой приложения, которое может публиковать контент, например, какой-то канал. Я хочу добавить контент в виде ссылки (как на стене Facebook).

Затем я хочу немного логики, чтобы проанализировать назначение ссылки и извлечь правильный текст и изображение, чтобы создать миниатюру.

Так же, как это делает Facebook, когда вы публикуете ссылку на своей стене.

Механизм извлечения / обхода кажется довольно сложным, но как лучше всего подойти к этому?

Я думал о том, чтобы обойти API-интерфейсы Facebook и «потом и потом вернуть» элемент из Facebook, и таким образом просто использовать их движок, но я действительно хотел бы сделать это как внутреннюю систему.