Wyniki wyszukiwania dla "hadoop"
Hive JDBC getConnection nie zwraca
Śledzę samouczek JDBC dotyczący gałęzi. Nie mogłem tego zrobić. Gdy próbuje uzyskać połączenie, po prostu zawiesza się. Nie zgłasza też żadnego błędu. Jestem...
Dołącz dwa zestawy danych w Mapreduce / Hadoop
Czy ktoś wie, jak zaimplementować operację Natural-Join między dwoma zestawami danych w Hadoop?Dokładniej, oto co dokładnie muszę zrobić:Mam dwa zestawy dany...
Konwersja CSV na SequenceFile
Mam plik CSV, który chciałbym przekonwertować na plik SequenceFile, którego ostatecznie użyłem do tworzenia nazwanych wektorów do wykorzystania w zadaniu gru...
Jak radzić sobie z pamięcią wycieku u świni
Mój kod wygląda tak:
Ponad 120 liczników w hadoop
Istnieje limit wielkości licznika Hadoop. Domyślnie jest 120. Próbuję użyć konfiguracji „mapreduce.job.counters.limit”, aby to zmienić, ale to nie działa. Wi...
Wykorzystanie wielu wejść mapujących w jednym zadaniu strumieniowania na hadoop?
W Javie używałbym:MultipleInputs.addInputPath (conf, ścieżka, inputFormatClass, mapperClass)aby dodać wiele wejść z innym maperem dla każdego.Teraz używam Py...