Dane panelu ustawień podrzędnych
Bardzo nowy, więc daj mi znać, jeśli to wymaga zbyt wiele. Próbuję ustawić dane panelu w R na dwie różne kategorie; taki, który zawiera kompletne informacje dla zmiennych i taki, który zawiera niekompletne informacje dla zmiennych. Moje dane wyglądają tak:
Person Year Income Age Sex
1 2003 1500 15 1
1 2004 1700 16 1
1 2005 2000 17 1
2 2003 1400 25 0
2 2004 1900 26 0
2 2005 2000 27 0
Muszę przejść przez każdą kolumnę (nie kolumny 1 i 2) i jeśli dane są pełne dla zmiennej (zmienne są zdefiniowane przez identyfikator w pierwszej kolumnie, a następnie nazwa kolumny, na zdjęciu powyżej przykład to person1Income) zwraca to do zestawu danych. Inaczej umieść to w innym zestawie danych. Oto mój meta kod i przykład tego, co powinien zrobić, biorąc pod uwagę powyższe dane. Uwaga: Wywołuję zmienne według ich nazwy id, a następnie nazwy kolumny, na przykład zmienna person1Income to pierwsze trzy wiersze w kolumnie trzeciej.
for(each variable in all columns except 1 and 2 in data set) if (variable = FULL) { return to data set "completes" }
else {put in data set "incompletes"}
completes = person1Income, person2Income, person1Age, person2Age, person1Sex, person2 sex
incompletes = {empty because the above info is full}
Rozumiem, że jeśli ktoś nie może całkowicie odpowiedzieć na to pytanie, docenia się wszelką pomoc. Także jeśli mój cel nie jest jasny, daj mi znać, a ja postaram się wyjaśnić.
tl; dr Nie mogę jeszcze wyjaśnić tego jednym zdaniem, więc ... przepraszam.
Edycja: wizualizacja tego, co rozumiem przez kompletne i niekompletne zmienne.zrzut ekranu