leyendo y escaneando archivos MS Word .doc en R

Tengo un gran conjunto de archivos .doc que dan las variables disponibles en un conjunto de conjuntos de datos correspondientes. Me gustaría explorar estos en R y ver qué conjuntos de datos contienen una variable de interés. He hecho esto antes en archivos de texto simple usando readLines pero esto no funciona en archivos .doc.

He descargado el paquete tm que debería poder leer archivos .doc con el comando readDOC, pero las instrucciones son bastante limitadas y no puedo hacer que funcione. ¿Alguien sabe cómo usar el comando readDOC o tiene otra sugerencia sobre cómo hacer esto en R? ¡Gracias!

Muchas gracias a todos por las respuestas y sugerencias. Pensé que R podría configurarse para leer archivos .doc con bastante facilidad, pero por lo que dices, creo que lo más fácil es convertir todos los archivos de Word a otro formato primero. Acabo de descargar un software gratuito llamado 'Convert Doc' donde almaceno todos los documentos de Word en una carpeta y los puse a archivos .txt muy rápidamente. Ahora puedo automatizar la búsqueda, ya que tengo alrededor de 100 archivos de datos con documentos de texto adjuntos que especifican la codificación variable, que no siempre es la misma en cada archivo de datos (por ejemplo, para sí / no, algunos usan 0/1, otros usan 1/2) así que esto me permite encontrar la variable correcta y almacenar su codificación utilizando readLines, grep y un poco más de procesamiento de texto. ¡Gracias!

Respuestas a la pregunta(1)

Su respuesta a la pregunta