важность PCA или SVD в машинном обучении

Все это время (особенно в конкурсе Netflix) я всегда сталкиваюсь с этим блогом (или форумом лидеров), где они упоминают, как применение простого шага SVD к данным помогло им уменьшить разреженность в данных или в целом улучшило производительность их алгоритма в рука. Я пытаюсь думать (с давних пор), но я не могу догадаться, почему это так. В общем, данные, которые я получаю, очень шумные (это тоже забавная часть bigdata), а затем я знаю некоторые базовые функции масштабирования, такие как преобразование журналов, то есть нормализация. Но как помогает что-то вроде СВД. Допустим, у меня есть огромная матрица фильмов с рейтингом пользователей ... и затем в этой матрице я реализую некоторую версию системы рекомендаций (например, совместную фильтрацию):

1) Without SVD
2) With SVD

как это помогает спасибо

Ответы на вопрос(3)

Ваш ответ на вопрос