Suchergebnisse für Anfrage "dataframe"

2 die antwort

Wie füge ich einen Spark-Datenrahmen am unteren Rand eines anderen Datenrahmens hinzu?

Ich kann nutzenwithcolumn, um einem Datenrahmen neue Spalten hinzuzufügen. Aber wie kann ich in Scala einem DataFrame neue Zeilen hinzufügen? Ich versuche, einem anderen Datenrahmen einen Datenrahmen hinzuzufügen. Entweder wie man Zeilen in ...

6 die antwort

Datenrahmen basierend auf NA auf mehreren Spalten filtern

Ich habe den folgenden Datenrahmen können Sie es df @ nenn id type company 1 NA NA 2 NA ADM 3 North Alex 4 South NA NA North BDA 6 NA CAIch möchte nur die Datensätze behalten, die keine NA in den Spalten "Typ" und "Firma" haben. id type company ...

6 die antwort

Der einfachste Weg, eine Liste mit Vektoren unterschiedlicher Länge in ein data.frame in R @ zu konvertier

Hier habe ich eine Liste mit verschiedenen Längenvektoren. Und ich möchte einen data.frame bekommen. Ich habe in SO viele Posts darüber gesehen (siehe Ref.), Aber keine davon ist so einfach wie ich erwartet hatte, da dies in ...

TOP-Veröffentlichungen

6 die antwort

Split Wert aus einem data.frame und erstellen Sie eine zusätzliche Zeile zum Speichern der Komponente

n R habe ich einen Datenrahmen mit dem Namen df wie die folgenden: A B C D a1 b1 c1 2.5 a2 b2 c2 3.5 a3 b3 c3 5 - 7 a4 b4 c4 2.5 Ich möchte den Wert der dritten Zeile und @ teilD Spalte am Bindestrich und erstellen Sie eine weitere Zeile für ...

4 die antwort

wie man mit Pandas - Python bestimmte Spalten aus Excel liest

Ich lese aus einer Excel-Tabelle und möchte bestimmte Spalten lesen: Spalte 0, da es sich um den Zeilenindex handelt, und Spalten 22:37. Nun, hier ist was ich tue: import pandas as pd import numpy as np file_loc = "path.xlsx" df ...

4 die antwort

Anzahl der Nicht-NaN-Einträge in jeder Spalte des Spark-Datenrahmens mit Pyspark

Ich habe einen sehr großen Datensatz, der in Hive geladen wird. Es besteht aus etwa 1,9 Millionen Zeilen und 1450 Spalten. Ich muss die "Abdeckung" jeder Spalte bestimmen, dh den Bruchteil der Zeilen, die für jede Spalte Nicht-NaN-Werte ...

6 die antwort

Unstrukturierte CSV-Datei in einen Datenrahmen konvertieren

Ich lerne R für Text Mining. Ich habe einen TV-Programmplan in Form von CSV. Die Sendungen beginnen in der Regel um 06:00 Uhr und dauern bis 05:00 Uhr des nächsten Tages, der als Sendetag bezeichnet wird. Beispiel: Die Programme für den ...

2 die antwort

Rang einer Zeile berechnen

Ich möchte die Benutzer-ID anhand eines Feldes bewerten. Für den gleichen Wert des Feldes sollte der Rang gleich sein. Diese Daten befinden sich in der Hive-Tabelle. z.B user value a 5 b 10 c 5 d 6 Rank a - 1 c - 1 d - 3 b - 4Wie kann ich das ...

14 die antwort

Pythonische / effiziente Methode zum Entfernen von Leerzeichen aus jeder Pandas Data-Frame-Zelle, in der sich ein stringartiges Objekt befindet

Ich lese eine CSV-Datei in einen DataFrame. Ich muss Leerzeichen von allen stringartigen Zellen entfernen und die anderen Zellen in Python 2.7 unverändert lassen. Hier ist was ich tue: def remove_whitespace( x ): if isinstance( x, basestring ...

4 die antwort

Spark dataframe transformiert mehrere Zeilen in eine Spalte

Ich bin ein Anfänger zu funken, und ich möchteverwandel untersource dataframe (aus JSON-Datei laden): +--+-----+-----+ |A |count|major| +--+-----+-----+ | a| 1| m1| | a| 1| m2| | a| 2| m3| | a| 3| m4| | b| 4| m1| | b| 1| m2| | b| 2| m3| | c| 3| ...