Daten des Nebeneinstellungsfelds
Sehr neu, also lass es mich wissen, wenn das zu viel verlangt. Ich versuche, Paneldaten in R in zwei verschiedene Kategorien zu unterteilen. eine mit vollständigen Informationen für Variablen und eine mit unvollständigen Informationen für Variablen. Meine Daten sehen so aus:
Person Year Income Age Sex
1 2003 1500 15 1
1 2004 1700 16 1
1 2005 2000 17 1
2 2003 1400 25 0
2 2004 1900 26 0
2 2005 2000 27 0
Was ich tun muss, ist durch jede Spalte (nicht die Spalten 1 und 2) zu gehen und wenn die Daten für die Variable voll sind (Variablen werden durch die ID in der ersten Spalte und dann den Spaltennamen definiert, im Bild oben ist ein Beispiel person1Income) geben Sie dies in einen Datensatz zurück. Andernfalls setzen Sie es in einen anderen Datensatz. Hier ist mein Meta-Code und ein Beispiel dafür, was er angesichts der oben genannten Daten tun sollte. Hinweis: Ich rufe Variablen nach ihrem ID-Namen und dem Spaltennamen auf, zum Beispiel wäre die Variable person1Income die ersten drei Zeilen in Spalte drei.
for(each variable in all columns except 1 and 2 in data set) if (variable = FULL) { return to data set "completes" }
else {put in data set "incompletes"}
completes = person1Income, person2Income, person1Age, person2Age, person1Sex, person2 sex
incompletes = {empty because the above info is full}
Ich verstehe, wenn jemand diese Frage nicht vollständig beantworten kann, aber jede Hilfe wird gebeten. Auch wenn mein Ziel nicht klar ist, lass es mich wissen und ich werde versuchen es zu klären.
Ich kann es noch nicht in einem Satz erklären, also ... Entschuldigung.
Bearbeiten: Visualisierung dessen, was ich unter vollständigen und unvollständigen Variablen verstehe.Bildschirmfoto