Результаты поиска по запросу "bigdata"
Загружать данные в Hive с помощью пользовательского разделителя
Я пытаюсь создать внутреннюю (управляемую) таблицу в кусте, которая может хранить мои дополнительные данные журнала. Таблица выглядит так:
Spark :: KMeans дважды вызывает takeSample ()?
У меня много данных, и я экспериментировал с разделами кардинальности [20k, 200k +].Я называю это так:
KMeans Spark не в состоянии обрабатывать большие данные?
KMeans имеет несколько параметров для егоповышение квалификации, с режимом инициализации по умолчанию kmeans ||. Проблема в том, что он быстро (менее 10 мину...
Читать n строк большого текстового файла
Самый маленький файл, который у меня есть, имеет> 850 тыс. Строк, и каждая строка имеет неизвестную длину. Цель состоит в том, чтобы прочитать
Почему Spark OneHotEncoder по умолчанию отбрасывает последнюю категорию?
Я хотел бы понять, почему в OneHotEncoder от Spark по умолчанию отбрасывается последняя категория.Например:
Кафка тема на одного производителя
Допустим, у меня есть несколько устройств. Каждое устройство имеет разные типы датчиков. Теперь я хочу отправить данные с каждого устройства для каждого датч...