Здесь в тексте данных - строка, разделенная вашим разделителем
я есть датафрейм, который имеет несколько многострочных наблюдений:
+--------------------+----------------+
| col1| col2|
+--------------------+----------------+
|something1 |somethingelse1 |
|something2 |somethingelse2 |
|something3 |somethingelse3 |
|something4 |somethingelse4 |
|multiline
row | somethings|
|something |somethingall |
Я хочу сохранить вcsv
Формат (илиtxt
) это датафрейм Используя следующее:
df
.write
.format("csv")
.save("s3://../adf/")
Но когда я проверяю файл, он разделяет наблюдения на несколько строк. Я хочу, чтобы строки с многострочными наблюдениями были одной и той же строкой в файле txt / csv. Я пытался сохранить его как текстовый файл:
df
.as[(String,String)]
.rdd
.saveAsTextFile("s3://../adf")
но такой же выход наблюдался.
Я могу себе представить, что одним из способов является замена\n
с чем-то еще и после при загрузке делай обратную функцию. Но есть ли способ сохранить его нужным способом без каких-либо преобразований в данные?