Результаты поиска по запросу "gradient-descent"

2 ответа

Расчет градиента для softmax-версии потери триплета

2 ответа

Алгоритмы градиентного спуска и стохастического градиентного спуска

Я пытался обучить нейронную сеть FeedForward в наборе рукописных цифр MNIST (включает 60K обучающих примеров).Я каждый раз перебиралвсе учебные образцы, выпо...

1 ответ

):

тив несколько экспериментов с TensorFlow, хочу взглянуть на реализацию некоторых функций, просто чтобы увидеть, как именно это делается, началось с простого случаяtf.train.GradientDescentOptimizer, Скачал zip полного исходного кода с github, ...

ТОП публикаций

3 ответа

Верна ли моя реализация стохастического градиентного спуска?

Я пытаюсь развить стохастический градиентный спуск, но я не знаю, правильно ли он на 100%. Стоимость, сгенерированная моим алгоритмом стохастического градиентного спуска, иногда очень далека от стоимости, сгенерированной FMINUC или ...

2 ответа

Функция стоимости в логистической регрессии дает NaN в результате

1 ответ

Sklearn SGDClassifier частичная подгонка

1 ответ

@RobRomijnders На самом деле, я ожидал, что ваш оригинальный вариант тоже работает. Я думал, что между оптимизаторами может быть внутренняя зависимость, но тензорная доска ничего не показала. Похоже, ошибка для меня.

дряю альтернативную схему обучения. График содержит две учебные операции. Обучение должно чередоваться между ними. Это актуально для таких исследований, какэто [https://arxiv.org/abs/1611.08408] или жеэто [https://arxiv.org/abs/1612.02649] Ниже ...

1 ответ

Spark Mllib предсказывает странное число или NaN

Я новичок в Apache Spark и пытаюсь использовать библиотеку машинного обучения для прогнозирования некоторых данных. Мой набор данных сейчас составляет всего ...

2 ответа

). Попробуйте добавить второй слой и посмотрите, что получится.

мы обучаем нейронные сети, мы обычно используем градиентный спуск, который опирается на непрерывную, дифференцируемую функцию реальной стоимости. Функция конечной стоимости может, например, принимать среднеквадратичную ошибку. Или, другими ...

1 ответ

Как интерпретировать лог кафе с помощью debug_info?