Почему веса нейронных сетей должны быть инициализированы случайными числами?
Я пытаюсь построить нейронную сеть с нуля. Во всей литературе по ИИ существует консенсус, что веса должны быть инициализированы случайными числами, чтобы сеть сходилась быстрее.
Но почему начальные веса нейронных сетей инициализируются как случайные числа?
Я где-то читал, что это делается длянарушать симметрию и это заставляет нейронную сеть учиться быстрее. Как нарушение симметрии делает обучение быстрее?
Wouldn»t инициализация весов в 0 будет лучшей идеей? Таким образом, веса смогут быстрее найти свои значения (положительные или отрицательные)?
Есть ли какая-то другая основная философия, стоящая за рандомизацией весов, кроме надежды на то, что они будут близки к оптимальным значениям при инициализации?