Результаты поиска по запросу "gradient-descent"

мы обучаем нейронные сети, мы обычно используем градиентный спуск, который опирается на непрерывную, дифференцируемую функцию реальной стоимости. Функция конечной стоимости может, например, принимать среднеквадратичную ошибку. Или, другими ...

tensorflow artificial-intelligence machine-learning python

1 ответ

):

тив несколько экспериментов с TensorFlow, хочу взглянуть на реализацию некоторых функций, просто чтобы увидеть, как именно это делается, началось с простого случаяtf.train.GradientDescentOptimizer, Скачал zip полного исходного кода с github, ...

machine-learning autodiff python tensorflow

1 ответ

@RobRomijnders На самом деле, я ожидал, что ваш оригинальный вариант тоже работает. Я думал, что между оптимизаторами может быть внутренняя зависимость, но тензорная доска ничего не показала. Похоже, ошибка для меня.

дряю альтернативную схему обучения. График содержит две учебные операции. Обучение должно чередоваться между ними. Это актуально для таких исследований, какэто [https://arxiv.org/abs/1611.08408] или жеэто [https://arxiv.org/abs/1612.02649] Ниже ...

ТОП публикаций

Test Test Test Test Test Test

21 Startup Ideas to Start Profitable Business in 2020

How To Build E-Learning Platform From Scratch: The Complex Guide From Idea to MVP

How to Raise Your Own SaaS Product off the Ground and Avoid Common Pitfalls

tensorflow conv-neural-network

1 ответ

Затем, чтобы использовать его при обучении, вы должны выполнить следующие действия (все еще из ответа, который вы связали):

я есть вопрос, похожий наэтот [https://stackoverflow.com/questions/42156957/how-to-update-model-parameters-with-accumulated-gradients] . Поскольку у меня ограниченные ресурсы, и я работаю с глубокой моделью (VGG-16), используемой для обучения ...

machine-learning caffe deep-learning neural-network

1 ответ

Вы можете иметь несколько слоев потерь. Кафе (как и любая другая достойная система глубокого обучения) справится с этим без проблем.

matlab machine-learning linear-regression

4 ответа

Метод градиентного спуска и нормального уравнения для решения линейной регрессии дает разные решения

tensorflow regression deep-learning neural-network

3 ответа

Почему глубокий NN не может аппроксимировать простую функцию ln (x)?

deep-learning neural-network python-3.x numpy

3 ответа

Нейронная сеть всегда предсказывает один и тот же класс

Я пытаюсь реализовать нейронную сеть, которая классифицирует изображения в одну из двух отдельных категорий. Проблема, однако, в том, что в настоящее время о...

neural-network

1 ответ

Выбор размера мини-пакета для регрессии нейронной сети

Я делаю регрессию нейронной сети с 4 функциями. Как определить размер мини-партии для моей проблемы? Я вижу, что люди используют размер партии 100 ~ 1000 для...

neural-network deep-learning machine-learning caffe

1 ответ

Как интерпретировать лог кафе с помощью debug_info?

Страница 1 из 3

12 3

Результаты поиска по запросу "gradient-descent"

). Попробуйте добавить второй слой и посмотрите, что получится.

):

Популярные теги

ТОП публикаций

Затем, чтобы использовать его при обучении, вы должны выполнить следующие действия (все еще из ответа, который вы связали):

Вы можете иметь несколько слоев потерь. Кафе (как и любая другая достойная система глубокого обучения) справится с этим без проблем.

Метод градиентного спуска и нормального уравнения для решения линейной регрессии дает разные решения

Почему глубокий NN не может аппроксимировать простую функцию ln (x)?

Нейронная сеть всегда предсказывает один и тот же класс

Выбор размера мини-пакета для регрессии нейронной сети

Как интерпретировать лог кафе с помощью debug_info?

Вы очень активны! Это здорово!

Результаты поиска по запросу "gradient-descent"

Популярные теги

ТОП публикаций