¿Cuáles son los nombres de entidad de caracteres HTML más largos y más cortos? [cerrado]

Hay un millón de cheatsheets alrededor de los tubos que enumeran a diferentes niveles de comprensión las entidades de caracteres especificadas por varias versiones y especificaciones de HTML. No quiero confiar en ninguno de ellos en particular, así que imagino que lo tiraré aquí y veré si alguien publica una respuesta más autoritaria.

Entonces, asumamos que quiero hacer coincidir cualquiera y todas las referencias de caracteres y entidades usando una expresión regular. Yo empezaria con/&(?:#(?:x[0-9a-f]+|[0-9]+)|[a-z]{???,???});/i. Pero que entraría???s? Puedo pensar en entidades que son dos caracteres largos, comolt ygt, pero ¿hay alguna entidad de una letra en alguna especificación del HTML? Del mismo modo, ¿cuál es la entidad más larga? Finalmente, esosson las únicas tres sintaxis para expresar caracteres literales en HTML además de escribirlas directamente, ¿no es así?

¡Aclamaciones!

Respuestas a la pregunta(3)

Su respuesta a la pregunta