Обсуждение статьи "Нейросети — это просто (Часть 12): Dropout"

MetaQuotes 2021.03.04 08:21

Опубликована статья Нейросети — это просто (Часть 12): Dropout:

Продвигаясь дальше в изучении нейронных сетей, наверное, стоит немного уделить внимания методам повышения их сходимости при обучении. Существует несколько таких методов. В этой статье предлагаю рассмотреть один из них — Dropout.

При обучении нейронной сети на вход каждого нейрона подается большое количество признаков и сложно оценить влияние каждого из них. В результате, ошибки одних нейронов сглаживаются правильными значениями других, а на выходе нейронной сети ошибки накапливаются. И как результат, обучение останавливается в некоем локальном минимуме с достаточно большой ошибкой. Данный эффект был назван совместной адаптацией признаков, когда влияние каждого признака как-бы подстраивается под окружающую среду. Для нас было бы лучше получить обратный эффект, когда среда будет разложена по отдельным признакам и оценивать отдельно влияние каждого.

Для борьбы со сложной совместной адаптацией признаков в июле 2012 года группа ученных из университета Торонто предложила случайным образом исключать часть нейронов в процессе обучения [12]. Снижение количества признаков при обучении повышает значимость каждого, а постоянное изменение количественного и качественного состава признаков снижает риск их совместной адаптации. Такой метод и получил название Dropout. Некоторые сравнивают применение данного метода с деревьями решений, ведь согласитесь, исключая часть нейронов, мы на каждой итерации обучения получаем новую нейронную сеть со своими весовыми коэффициентами. А по правилам комбинаторики вариативность таких сетей довольно высока.

Автор: Dmitriy Gizlyk

Dmitry Nazarov 2021.03.04 10:58 #1

Обратите внимание, при использовании в Fractal_OCL_AttentionMLMH_d вместо Net.feedForward(TempData,12,true);

проверку if(!Net.feedForward(TempData,12,true))

printf("error in Net feed forward. check topology and input data");

будет выдавать ошибку. В отличии от версии Fractal_OCL_AttentionMLMH, где такой ошибки не будет.

Прошу проверить причину.

Automated Trading Championship 2007: Вопросы от начинающих MQL5 Мой эксперт выполняет двойную

Dmitriy Gizlyk 2021.03.04 12:52 #2

Dmitry Nazarov:

Обратите внимание, при использовании в Fractal_OCL_AttentionMLMH_d вместо Net.feedForward(TempData,12,true);

проверку if(!Net.feedForward(TempData,12,true))

printf("error in Net feed forward. check topology and input data");

будет выдавать ошибку. В отличии от версии Fractal_OCL_AttentionMLMH, где такой ошибки не будет.

Прошу проверить причину.

Спасибо, проверю.

Aleksey Mavrin 2021.03.05 12:44 #3

Надо проверку всех подаваемых значений на NaN, Inf, иначе ФидФорвард фальш ретурнит.

Dmitriy Gizlyk 2021.03.05 15:22 #4

Dmitry Nazarov:

Обратите внимание, при использовании в Fractal_OCL_AttentionMLMH_d вместо Net.feedForward(TempData,12,true);

проверку if(!Net.feedForward(TempData,12,true))

printf("error in Net feed forward. check topology and input data");

будет выдавать ошибку. В отличии от версии Fractal_OCL_AttentionMLMH, где такой ошибки не будет.

Прошу проверить причину.

Попробуйте этот вариант, у меня не было ошибок.

Файлы:

Fractal_OCL_AttentionMLMH_d.mq5 44 kb

NeuroNet.mqh 594 kb

Dmitry Nazarov 2021.03.05 20:57 #5

Ок. Ошибки больше нет. Спасибо.

JuniorFurtado 2021.03.08 15:33 #6

Большое спасибо за эту статью. Я уже адаптировал своих роботов для новых функций, и они отлично работают.

Alexey Volchanskiy 2021.03.09 18:23 #7

Я так понимаю, что без OCL ничего не работает? Жаль, я не игрун и карта старая...

buruy 2021.03.15 10:52 #8

Автору большое СПАСИБО за проделанную роботу, проверьте ошибку в коде самого советника так как во время обучения, когда алгоритм показывает сигнал undefine количество пропущенных паттернов стремится к 100 % , когда в конце эпохи на последнем баре появляется buy или sell, тогда на следующей эпохе значенние пропущенных паттернов уменьшается.

Помощь в кодировании Обучение нейросети Анализ баров в обратном

buruy 2021.03.15 10:56 #9

Alexey Volchanskiy:
Я так понимаю, что без OCL ничего не работает? Жаль, я не игрун и карта старая...

Если процессор многоядерный поставь драйвера на OCL для процессора, скорость будет не мега быстро но сможешь проверить.

Dmitry Nazarov 2021.03.21 18:14 #10

Дмитрий, можете чуть шире объяснить параметр window в создании Нейронки. Правильно ли я понимаю, что это кол-во нейронов последовательно (с шагом степ) которые берутся для одномоментного расчета? для экономии вычислительных мощностей?

Асинхронное и многопоточное программирование Нейросети,как их освоить с Использование OpenCV для распознавания

1 2

Новый комментарий