Wyniki wyszukiwania dla "bigdata"
importuj złożone dane Json do gałęzi
Niezbędne jest trochę karmienia łyżeczką, jak zaimportować kompleks json do ula. Plik Json w formacie:
Praca z dużymi danymi w python i numpy, niewystarczająca ilość pamięci RAM, jak zapisać częściowe wyniki na dysku?
Usiłuję zaimplementować algorytmy dla danych 1000-wymiarowych z 200k + punktami danych w Pythonie. Chcę używać bibliotek numpy, scipy, sklearn, networkx i in...
Model danych Cassandry dla szeregów czasowych
Pracuję nad modelem danych Cassandra do przechowywania szeregów czasowych (jestem nowicjuszem Cassandry). Mam dwie aplikacje: dane giełdowe w ciągu dnia i da...
Jak przyspieszyć szacowanie GLM?
Używam RStudio 0.97.320 (R 2.15.3) na Amazon EC2. Moja ramka danych ma 200k wierszy i 12 kolumn.Próbuję dopasować regresję logistyczną z około 1500 parametra...
Jak uzyskać tablicę / worek elementów z grupy Hive według operatora?
Chcę pogrupować według danego pola i uzyskać dane wyjściowe z polami zgrupowanymi. Poniżej znajduje się przykład tego, co próbuję osiągnąć: -Wyobraź sobie ta...
Jak utworzyć dużą ramkę danych pand z zapytania sql bez wyczerpania pamięci?
Mam problem z zapytaniem o tabelę> 5 milionów rekordów z mojej bazy danych MS SQL Server. Chcę mieć możliwość wyboru wszystkich rekordów, ale mój kod wyda...
Jak wyprowadzić wyniki zapytania HiveQL do CSV?
chcielibyśmy umieścić wyniki zapytania Hive w pliku CSV. Myślałem, że polecenie powinno wyglądać tak: