Обсуждение статьи "Нейросети — это просто (Часть 39): Go-Explore — иной подход к исследованию" - страница 2

 
Dmitriy Gizlyk #:


Здравствуйте Дмитрий. 

Можно ли этот подход отождествить с "алгоритмом оптимизации с памятью" 

Где алгоритм помнит свою историю поиска или есть ещё какой то тонкий момент который я не уловил? 

 
Почему в блоке случайных действий агента три варианта купить/продать/закрыть все позиции? Почему нет варианта "удерживать прибыльную позицию(ничего не предпринимать)". Случайное действие осуществляется на открытии часовой свечи, если сделка в плюсе почему ее обязательно закрывать? За час иногда и 300 пунктов можно получить.
 
npats2007 #:
Почему в блоке случайных действий агента три варианта купить/продать/закрыть все позиции? Почему нет варианта "удерживать прибыльную позицию(ничего не предпринимать)". Случайное действие осуществляется на открытии часовой свечи, если сделка в плюсе почему ее обязательно закрывать? За час иногда и 300 пунктов можно получить.

Обратите внимание, что мы семплируем их 4 действий. Агент может выполнить одно из 3 действий:

0 - купить
1 - продать
2 - закрыть все открытые позиции
и 3 -ждать, не совершать никаких действий.

Действие 3 относится к ожиданию подходящего состояния открытия или закрытия действий. В том числе и описанная Вами ситуация накопления прибыли. Только в дынном случае советник не совершает торговых операций. Поэтому умышленно опущена обработка такого действия.

 
Dmitriy Gizlyk #:

Обратите внимание, что мы семплируем их 4 действий. Агент может выполнить одно из 3 действий:

0 - купить
1 - продать
2 - закрыть все открытые позиции
и 3 -ждать, не совершать никаких действий.

Действие 3 относится к ожиданию подходящего состояния открытия или закрытия действий. В том числе и описанная Вами ситуация накопления прибыли. Только в дынном случае советник не совершает торговых операций. Поэтому умышленно опущена обработка такого действия.

 Понял. Спасибо.

 

По прежнему открывает только бай и доливает на каждом баре. Подскажите, как бороться с этой бедой? У кого то он совершает какие то осмысленные действия?

Файлы:
6u3_m6ydd.png  62 kb
 
Я, кажется, понял его. Он считает, что единственная доходная стратегия - открыться и ждать, не глядя на просадки. Поскольку евро сейчас на подъеме - открывается бай. Вот будет потеха, если он начнет открывать короткие, когда тренд сменится! Если доживу, обязательно проверю!
 

А сколь вы его фазой 2 тренировали? Сколько раз запускали фазу 2?

И какая ошибка была при переходе к фазе 3?

И у меня с каждым запуском фазы 2 ошибка растёт. Это вообще нормально? Просто я как понимаю у нейронной сети в процессе обучения ошибка должна падать, а тут получается наоборот...

 

I got this error.

2023.05.07 20:04:44.281 Core 01 pass 359 tested with error "critical runtime error 502 in OnTester function (array out of range, module Experts\GoExploer\Faza1.ex5, file Faza1.mq5, line 223, col 12)" in 0:00:00.202

//--- copy cell

   actions[action_count] = act;

   Base[action_count].total_actions = action_count+StartCell.total_actions;


how to solve it?


 
Viktor Kudriavtsev #:

А сколь вы его фазой 2 тренировали? Сколько раз запускали фазу 2?

И какая ошибка была при переходе к фазе 3?

И у меня с каждым запуском фазы 2 ошибка растёт. Это вообще нормально? Просто я как понимаю у нейронной сети в процессе обучения ошибка должна падать, а тут получается наоборот...

Если ошибка постоянно растет, попробуйте уменьшить коэффициент обучения.

 
Zhongquan Jiang #:

I got this error.

2023.05.07 20:04:44.281 Core 01 pass 359 tested with error "critical runtime error 502 in OnTester function (array out of range, module Experts\GoExploer\Faza1.ex5, file Faza1.mq5, line 223, col 12)" in 0:00:00.202

//--- copy cell

   actions[action_count] = act;

   Base[action_count].total_actions = action_count+StartCell.total_actions;


how to solve it?


What's period of study?