Cómo hacer buenos ejemplos reproducibles de Apache Spark

He pasado bastante tiempo leyendo algunas preguntas con elpyspark ymarco de datos de chispa etiquetas y muy a menudo encuentro que los carteles no proporcionan suficiente información para comprender realmente su pregunta. Normalmente comento pidiéndoles que publiquen unMCVE pero a veces hacer que muestren algunos datos de entrada / salida de muestra es como tirar de los dientes. Por ejemplo: ver los comentarios enesta pregunta.

Quizás parte del problema es que las personas simplemente no saben cómo crear fácilmente un MCVE para marcos de datos de chispa. Creo que sería útil tener una versión de marco de datos de chispa deesta pregunta de los pandas como una guía que se puede vincular.

Entonces, ¿cómo se puede crear un buen ejemplo reproducible?

Respuestas a la pregunta(4)

Su respuesta a la pregunta