Почему веса нейронных сетей должны быть инициализированы случайными числами?

Я пытаюсь построить нейронную сеть с нуля. Во всей литературе по ИИ существует консенсус, что веса должны быть инициализированы случайными числами, чтобы сеть сходилась быстрее.

Но почему начальные веса нейронных сетей инициализируются как случайные числа?

Я где-то читал, что это делается длянарушать симметрию и это заставляет нейронную сеть учиться быстрее. Как нарушение симметрии делает обучение быстрее?

Wouldn»t инициализация весов в 0 будет лучшей идеей? Таким образом, веса смогут быстрее найти свои значения (положительные или отрицательные)?

Есть ли какая-то другая основная философия, стоящая за рандомизацией весов, кроме надежды на то, что они будут близки к оптимальным значениям при инициализации?

Ответы на вопрос(4)

Ваш ответ на вопрос