Здесь в тексте данных - строка, разделенная вашим разделителем

Question

Sep 25, 2017, 05:08 PM

Здесь в тексте данных - строка, разделенная вашим разделителем

я есть датафрейм, который имеет несколько многострочных наблюдений:

+--------------------+----------------+
|         col1|               col2|
+--------------------+----------------+
|something1           |somethingelse1  |
|something2           |somethingelse2  |
|something3           |somethingelse3  |
|something4           |somethingelse4  |
|multiline

 row               |     somethings|
|something            |somethingall    |

Я хочу сохранить вcsv Формат (илиtxt) это датафрейм Используя следующее:

df
 .write
 .format("csv")
 .save("s3://../adf/")

Но когда я проверяю файл, он разделяет наблюдения на несколько строк. Я хочу, чтобы строки с многострочными наблюдениями были одной и той же строкой в файле txt / csv. Я пытался сохранить его как текстовый файл:

df
.as[(String,String)]
.rdd
.saveAsTextFile("s3://../adf")

но такой же выход наблюдался.

Я могу себе представить, что одним из способов является замена\n с чем-то еще и после при загрузке делай обратную функцию. Но есть ли способ сохранить его нужным способом без каких-либо преобразований в данные?

Здесь в тексте данных - строка, разделенная вашим разделителем

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Здесь в тексте данных - строка, разделенная вашим разделителем

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы