¿Cómo crear conjuntos de datos de ejemplo a partir de datos privados (reemplazando nombres y niveles de variables con marcadores de posición no informativos)?
Para proporcionar un ejemplo reproducible de un enfoque, a menudo se debe proporcionar un conjunto de datos. En lugar de crear un conjunto de datos de ejemplo, deseo utilizar algunos de mis propios datos. Sin embargo, estos datos no pueden ser liberados. Deseo reemplazar los nombres de las variables (columna) y los niveles de factores con marcadores de posición no informativos (por ejemplo, V1 .... V5, L1 .... L5).
¿Es una forma automatizada de hacer esto disponible?
Idealmente, esto se haría en R, tomando un data.frame y produciendo este data.rame anónimo.
Con tal conjunto de datos, simplemente busque y reemplace los nombres de variables en su script y tendrá un ejemplo reproducible que se puede liberar públicamente.
Dicho proceso puede aumentar la inclusión de datos apropiados en ejemplos reproducibles e incluso la inclusión de ejemplos reproducibles en preguntas, comentarios e informes de errores.