Где грань между подгонкой и реальными закономерностями? - страница 50

 
Gerasimm:
Да я в курсе.. Не буду этим заниматься. Я сконфигурировал в принципе мысль.Но пока комп не отличит кота от кошки по внешним признакам, этим мучиться бесполезно.А когда отличит, рынок будет иметь совершенно другой вид.. :о)

"Хвостовое последействие" - для оптимизированных ТС явление настолько распространённое, что даже демонстрировать влом.

Не обнаружить его фактически можно только если гоняться не за профитом, а за доказательством невозможности существования закономерностей.

Удачи.

 

Думал, думал и выдумал: А не лежит ли поиск закономерностей несколько "глубже" подгонки? Поясню на примере эксперимента который я веду. Есть нейросетка которую я использую. Обычно я ее обучаю час-два. Где-то 30-50% процентов результатов успешно проходят форворд тесты (1/6 от периода обучения) . Проблема их выявить, простая угадайка в данном случае работает против меня. Попробовал обучать 4 часа, - печалька, лишь где-то 20% успешных форвордов. Вывод: переобучаемся, пошла подгонка. Расстроился и.... решил продолжить обучение. 12 часов, теже 20 процентов. 24 часа, снова 20%, но заметил, они проходят форварды лишь немногим хуже периода обучения. Раньше даже лучшие результаты демонстрировали некое заметное снижение результативности, причем эти 20% оказались фактически лучшими результатами обучения из всех наборов. Раньше они были размазаны примерно равномерно среди прочих. Стало интересно. Провел обучение почти 72 часа на текущий момент. О чудо. из 200 лучших результатов, больше 123 проходят успешно форвард тестирование. Можно пытаться профитно играть в угадайку.

Увеличение времени обучения вело к постепенному улучшению результата на Sample периоде. Что естественно. Результат за 72 часа превзошел результат за 2 часа более чем в 4 раза. Результат OOS тоже в конечном счете улучшился, но о постепенности тут говорить не приходится, был очевидный провал.

__________

О чем это говорит?

Грустный и очевидный вариант: О несовершенстве методики обучения и перегруженнности НС) Классический ГА грузноват для обучения НС, но да там есть чего подкрутить.. Много свободы у НС, входы НС тоже явно избыточны и не все достаточно информативны, НС достаточно много их "исключила" в процессе обучения. Можно также поэкперементировать и с архитектурой.

Оптимистичный и возможно преждевременный: ТС способная своим "нутром" выявить закономерности, просто "обязана" это сделать, что бы достичь своего лучшему результата на периоде обучения. Разумеется, если эти закономерности значимы для этого результата.

 
MetaDriver:

Тэкс. Не знаю уж какое отношение имеет данный спор/холивар к поиску/рождению истины, но похоже мне таки удалось для себя обозначить ответ на тему топика.

Искомая грань находится в точке между левой и правой частями графика и определяется так:

Если данная-конкретная ТС, будучи оптимизирована на левой части графика статистически склонна* к "профитному хвосту"** на правой части графика - значит закономерность есть.

Иначе - беспонтовая подгонка.

// статистически склонна* - в данном контексте имеются в виду многократные (1)смещения временных границ оптимизации и (2)смена торговых инструментов

// "профитный хвост"** - "последействие". Статистическая плюс-профитность на примыкающем участке будущего.

Данное определение учитывает возможность существование как "вечных", так и временных закономерностей.

Обозначенная грань точна в качественном смысле. Далее - только количественные оценки (время жизни, степень проявленности и т.д.). Или мусорная корзина.


Согласен на 100%.

Герасим вкладывает несколько иное понятие в подгонку, как в поиск закономерностей, уравнивая их, тем самым стирая грань, а они как раз и отличны тем, что при подгонке на истории - на форварде система льет, но при "настройке" на реальную закономерность на периоде оптимизации - форвард профитный (хотя бы до 25% периода оптимизации).

Это как раз та самая грань и есть, о чем Вы написали. Другой вопрос, как не превратить поиск ("настройку на") реальной закономерности в подгонку по истории -

здесь уже зависит и от времени оптимизации, шага изменения входных параметров, подготовки входных параметров и т.д., каждый кто в теме знает и ориентируется...

Повторюсь - по этому вопросу ("как...) можно подробнее здесь глянуть.

 
Figar0:

1. Провел обучение почти 72 часа на текущий момент. О чудо. из 200 лучших результатов, больше 123 проходят успешно форвард тестирование. Можно пытаться профитно играть в угадайку.

Увеличение времени обучения вело к постепенному улучшению результата на Sample периоде. Что естественно. Результат за 72 часа превзошел результат за 2 часа более чем в 4 раза. Результат OOS тоже в конечном счете улучшился, но о постепенности тут говорить не приходится, был очевидный провал.

__________

2. О чем это говорит?

1. Если многократное воспроизведение эксперимента покажет повторяемость данного "чуда" для разных времён и народов инструментов, можно говорить о закономерности полученного результата.

2. Пока почти ни о чём. См. пункт 1.

 
Где грань между подгонкой и реальными закономерностями?

Попробую рассуждать логично.

1) Что такое закономерность? Одинаковое поведение цены при определенных условиях.

2) Что описывают условия? Некоторые выбранные характеристики графика цены.

3) Храктеристики графика цены постоянны? В целом непостоянны.

4) Чем определяется характеристика? Показателями по времени и по цене.

5) Следовательно, когда возможно одинаковое поведение цены? Возможно при непостоянных(разных) показателях.

6) Что характеризует непостоянство показателей? Характеристики процесса, учитывающие время и цену, описывающего изменение показателей.

7) Следовательно, что такое закономерность на рынке? Закономерность - это одинаковое поведение цены при определенных изменениях характеристик процесса,учитывающих время и цену, и описывающего изменение показателей характеристик графика цены, описывающих закономерность.

Получается, что закономерность от подгонки отличается тем, что условия реализации закономерности(одинакового поведения) меняются синхронно с изменением графика цены по неким законам, а у подгонки - не меняются. Получается, что статично заданные условия могут описывать закономерность редко, т.к. постоянных характеристик у рынка гораздо меньше, чем переменных. Грань таким образом выделяет динамические системы анализа как тип, которому присущи лучшие возможности описания закономерностей.

 
Gerasimm:
Да я в курсе.. Не буду этим заниматься. Я сконфигурировал в принципе мысль.Но пока комп не отличит кота от кошки по внешним признакам, этим мучиться бесполезно.А когда отличит, рынок будет иметь совершенно другой вид.. :о)
Причем здесь кошки?
 
-Aleksey-:

Попробую рассуждать логично.

1) Что такое закономерность? Одинаковое поведение цены при определенных условиях.

Цена не может быть одинаковой при определенных условиях. Проще говоря вероятность того, что история повториться с точностью до пипса близка к 0. Причина тому - наличие шума в котировках.

Поскольку ТА основан на поиске чего то там в прошлом, дабы эксплуатировать это самое нечто в будущем, то:

1. Шум - некие паттерны прошлого без памяти - случайные процессы. Поскольку имеет место дисперсия, то паттерны в исторических данных распределены неравномерно, т.е. то густо, то пусто. Нарвавшись на значительное скопление шумовых паттернов предшествующих некоему поведению цены с большой вероятностью, ТС во время оптимизации (обучения) может принять эти самые паттерны за "торговые сигналы". Естественно, что такие "закономерности" с очень малой вероятностью пройдут форвардные тесты, т.к. чрезмерное скопление на разных участках исторических данных, маловероятно, а отсутствие стабильных причинно-следственных связей, т.е. памяти даст убыток.

2. Реальные торговые сигналы - некие паттерны прошлого предшествующие некоему поведению цены в будущем, т.е. процессы неслучайные и имеющие память. Поскольку данные паттерны предшествуют торговым сигналам, то они скапливаются равномерно, т.е. сначала паттерн, потом торговый сигнал - стабильная причинно-следственная связь (Если она нестабильна - это уже не закономерность). Если ТС выявит эти самые закономерности, хотя бы частично, то может пройти форвардные тесты.

Теоретически можно попытаться отфильтровать шум от закономерностей. Т.е. на форвардных тестах взять все торговые сигналы и разделить на две категории:

1. Сигнал дал убыток - шум

2. Сигнал дал профит - закономерность

Далее, например, можно обучить НС отличать шум от закономерностей по дополнительным признакам. В результате, получаем ТС с шумоподавителем. Какой-то процент шума все равно просочиться, но 100% шумоподавителей в природе не бывает

Короче говоря, фильтровать базар нужно по результатам форвардных тестов - вне выборки, т.е. OOS, а не на репрезентативной выборке - Sample. Если фильтровать сигналы на Sample, что многие пытаются сделать - получаем подгонку в квадрате.

 
Reshetov:

1. Сигнал дал убыток - шум

2. Сигнал дал профит - закономерность

хахахахахахахаха

Это как деление животных на "вредных" и "полезных"... Так и тут - есть движение цены... Но если мы на нем копейку заработали, то снисходим до того, чтобы именовать его "закономерным"... Иначе это бессмысленный "шум" - конечно, нам же от этого лучше не стало, это обязано быть случайностью...

Шаманы! Антропоцентристы! Бога не гневите!

:)

 
Нет на рынке никакого шума. Весь шум только в голове.
 
paukas:
Причем здесь кошки?

Отвечу песней (Эдуард Суровый).. Можно обойтись и без кошек, но суть от этого не меняется.. Мы заставляем машину мерить душу линейкой.. и пытаемся ещё выявить закономерности. Они несомненно есть, но их можно рассматривать или все одновременно (что займёт какие то довольно большие ресурсы) или не париться с прикручиванием к текущей истории по одному/нескольким инструментам, потому что это сто проц. подгонка.А поскольку это фактически броуновское движение, можно получать только фрагментарные результаты. Как тут например (+/-/++/---/+/--/+++/--/+/--/).Визуально кажется, что плюсов больше, потому что мы хотим этого, но на самом деле это не так..



скорее всего следующий вопрос - А где песня? :о))