¿Sabe Facebook que lo estoy raspando con PhantomJS y puede cambiar su sitio web para contrarrestarme?

Entonces, tal vez estoy siendo paranoico.

Estoy raspando mi línea de tiempo de Facebook para un proyecto de pasatiempo usando PhantomJS. Básicamente, escribí un programa que encuentra todos mis anuncios consultando el texto de la páginaSponsored con XPATH dentro del fantasmapage.evaluate bloquear. El texto se mostraba como innerHTML de htmla elementos.

Las cosas funcionaron muy bien durante unos días y fue encontrar toneladas de anuncios.

Luego dejó de devolver los resultados.

Cuando inicié sesión en Facebook manualmente para inspeccionar los elementos nuevamente, descubrí que la palabraSponsored ahora aparecía en la página en un::after elemento pseudoclase con la propiedad csscontent: sponsored. Esto significa que una consulta XPATH para el texto ya no produce ningún resultado. No es broma, Facebook parecía haber cambiado la forma en que pronunciaban esta palabra después de ser descartados durante un par de días.

Paranoico. Te lo dije.

Entonces, ofrezco esta pregunta a la comunidad de desarrolladores de Javascript, Web-Scraping y PhantomJS. Qué diablos está pasando. ¿Puede Facebook saber qué está haciendo mi programa PhantomJS dentro delpage.evaluate ¿bloquear?

¿Si es así, cómo? ¿Aparecerían mis comandos fantasmas en un programa de registro de teclas incrustado en la página, por ejemplo?

¿Cuáles son algunas de tus teorías?

Respuestas a la pregunta(1)

Su respuesta a la pregunta