Результаты поиска по запросу "pyspark-sql"

1 ответ

Благодарю. Надеюсь, что это будет ссылаться на других.

отаю над обновлением базы данных mysql с использованием pyspark framework и работаю на сервисах AWS Glue. У меня есть датафрейм следующим образом: df2= sqlContext.createDataFrame([("xxx1","81A01","TERR NAME 55","NY"),("xxx2","81A01","TERR NAME ...

3 ответа

В вопросе говорится «без использования панд».

аюсь преобразовать следующий Pythondict в PySpark DataFrame, но я не получаю ожидаемый результат. dict_lst = {'letters': ['a', 'b', 'c'], 'numbers': [10, 20, 30]} df_dict = sc.parallelize([dict_lst]).toDF() # Result not as expected ...

0 ответов

я использовал код выше

дал 3 кадра данных, выполнив следующий код. sample.csv id|code|name|Lname|mname 2|AA|BB|CC|DD|sample1.csv id|code|name|Lname|mname 1|A|B|C|D|sample2.csv id1|code1|name1|Lnam|mnam 3|AAA|BBB|CCC|DDD|Я сравнил заголовки фреймов данных, используя ...

ТОП публикаций

1 ответ

Большое спасибо за этот быстрый и точный ответ.

ользую pyspark 2.3.1 и хотел бы фильтровать элементы массива с помощью выражения, а не использования udf: >>> df = spark.createDataFrame([(1, "A", [1,2,3,4]), (2, "B", [1,2,3,4,5])],["col1", "col2", "col3"]) >>> ...

2 ответа

В конце вам нужно иметь только 1 запись в вашем фрейме данных, чтобы получить ожидаемый результат.

аюсь создать вложенный JSON из моего фрейма данных искры, который имеет данные в следующей структуре. Приведенный ниже код создает простой JSON с ключом и значением. Не могли бы вы ...

1 ответ

drive.google.com/file/d/1NA8B1_pBH_vQB1mduxS7eao5BtFiY3GP/...

аюсь написать скрипт в блоках данных, который будет выбирать файл на основе определенных символов в имени файла или только на отметке даты в файле. Например, следующий файл выглядит следующим ...

1 ответ

Я не знал этого, я думал, что только код будет более прямым, эффективным и читабельным. Я добавлю немного контекста;)

аюсь создать вложенный JSON снизу данных. Только имена полей, такие какsegid а такжеval постоянны, остальное не является постоянным. Мне нужно поместить их в список категорий. Не могли бы вы помочь. [/imgs/NRMzc.png] Ожидаемый результат: [{ ...

1 ответ

 функционирование в PYSPARK?

я есть код T-SQL, как показано ниже cast( dateadd(minute, - 240, tmp_view_tos_lenelgate_qry11.eventdate) as dateКак реализоватьDATE_ADD функционирование в PYSPARK?