Cómo hacer una captura de pantalla de una página HTML renderizada.

Nuestro paquete de análisis web incluye información detallada sobre la actividad del usuario dentro de una página, y mostramos visualizaciones (clic / desplazamiento / interacción) en una superposición encima de la página web. Actualmente este es un IFrame que contiene una representación en vivo de la página.

Como las páginas cambian con el tiempo, los datos más antiguos ya no corresponden al diseño actual de la página. Nos gustaría ejecutar una araña para tomar de vez en cuando instantáneas de las páginas, lo que nos permite mantener un registro de las interacciones con varias versiones de la página.

Tenemos una implementación operativa de esto (Linux), pero el proceso de instantáneas es un hack de Python / JavaScript / HTML que abre una ventana de Firefox, captura de pantalla, desplazamiento, combinación y guardado en un archivo. Esto requiere que instalemos la pila X en nuestros servidores normalmente sin cabeza, y toma más de un minuto por página.

Preferiríamos una implementación sin cabeza con un rendimiento más cercano al del tiempo de representación en un navegador web normal, pero no hemos encontrado nada.

Hay un movimiento hacia la construcción de algo utilizando la fuente de Mozilla como punto de partida, pero eso me parece una exageración, así como una pesadilla de mantenimiento si intentamos mantenerlo actualizado.

Sugerencias?

Respuestas a la pregunta(3)

Su respuesta a la pregunta