Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1308

 
Aleksey Vyazmikin:

Хорошо, пусть так и будет. У меня нет статистики по высказываниям сотни лиц участвующих в создании разных методов МО, нет желания спорить, так как изначально я говорил о том, как удобно мне разделять понятия в уме, а коли иным это не удобно, то пусть я останусь один со своими понятиями.

Да уж, тема и так уже изрядно заспамлена, а теперь еще и приходится каждому выдумывать и собственнею терминологию:)
 
Хотя конкретно по наименованию выборок данных, думаю спорить нет смысла т.к. есть множество всяких методов их формирования и использования, а существенным, ИМХО, остается только один факт - участвовали эти данные (In-Sample) или не участвовали (Out-Of-Sample), в процессе обучения.
Потому, что все IS выборки так или иначе применяются для подгонки модели, а OOS только для оценки ее качества.


А что бы было однозначное понимание, думаю логично было бы представлять результаты в привычном для тестера виде, где все выборки, которые использовалось при обучении - IS представлять как бэктест, а OOS как форвард.

 
Ivan Negreshniy:

Да уж, тема и так уже изрядно заспамлена, а теперь еще и приходится каждому выдумывать и собственнею терминологию:)
 
Хотя конкретно по наименованию выборок данных, думаю спорить нет смысла т.к. есть множество всяких методов их формирования и использования, а существенным, ИМХО, остается только один факт - участвовали эти данные (In-Sample) или не участвовали (Out-Of-Sample), в процессе обучения.
Потому, что все IS выборки так или иначе применяются для подгонки модели, а OOS только для оценки ее качества.


А что бы было однозначное понимание, думаю логично было бы представлять результаты в привычном для тестера виде, где все выборки, которые использовалось при обучении - IS представлять как бэктест, а OOS как форвард.


Лучше отдельными графиками показывать, так как выборка не участвовавшая в обучении как правило значительно меньше той, что участвовала и визуально ничего не понятно на таком рваном графике, вот лично для меня.

 
Кстати, в Кэтбусте есть кроссвадидация - тогда там как раз не нужен ключ "test", а используется одна выборка, которая разбивается разными способами на части.
 
Aleksey Vyazmikin:
Кстати, в Кэтбусте есть кроссвадидация - тогда там как раз не нужен ключ "test", а используется одна выборка, которая разбивается разными способами на части.

С такими вещами работают ученые, но и они не понимают что происходит в нейронных сетях, а тем боле в лесах, как и по какой причине всё там именно такое как получается, где что меняется в какой момент и почему, нам остаётся только доверять их авторитету и применять их модели, уповая на высшие силы.

 
Кеша Рутов:

С такими вещами работают ученые, но и они не понимают что происходит в нейронных сетях, а тем боле в лесах, как и по какой причине всё там именно такое как получается, где что меняется в какой момент и почему, нам остаётся только доверять их авторитету и применять их модели, уповая на высшие силы.

Лесами/деревьями вы явно не занимались. Их решения легко интерпретируются человеком. Любая базовая статейка о алгоритме построения дерева за пару страниц объяснила бы вам это.
 
Aleksey Vyazmikin:

Хорошо, пусть так и будет. У меня нет статистики по высказываниям сотни лиц участвующих в создании разных методов МО, нет желания спорить, так как изначально я говорил о том, как удобно мне разделять понятия в уме, а коли иным это не удобно, то пусть я останусь один со своими понятиями.

Упрямство близко по смыслу с упорством. Надеюсь они помогут вам дойти до успешного воплощения ваших идей в МО. Для исследователей это - полезные качества. ;-)

ПС Придумал название для вашей системы по отбору листьев: "Гербарий" - пополните коллекцию методов из деревьев, лесов, пней, джунглей.
 
elibrarius:

ПС Придумал название для вашей системы по отбору листьев: "Гербарий" - пополните коллекцию методов из деревьев, лесов, пней, джунглей.

))) Я бы назвал Лесоповалом или Пилорамой.

 
Кеша Рутов:

С такими вещами работают ученые, но и они не понимают что происходит в нейронных сетях, а тем боле в лесах, как и по какой причине всё там именно такое как получается, где что меняется в какой момент и почему, нам остаётся только доверять их авторитету и применять их модели, уповая на высшие силы.

Отчасти согласен, сейчас эра быстрых вычислений, и если раньше люди делали вычисления на бумаге, прежде чем получить доступ к ЭВМ, то сейчас объем информации и методы её обработки столь велики, что часто более целесообразно концентрироваться не на процессе, а результате.

 
elibrarius:

Упрямство близко по смыслу с упорством. Надеюсь они помогут вам дойти до успешного воплощения ваших идей в МО. Для исследователей это - полезные качества. ;-)

ПС Придумал название для вашей системы по отбору листьев: "Гербарий" - пополните коллекцию методов из деревьев, лесов, пней, джунглей.

Быть упоротым не всегда продуктивно, но спасибо за оценку моего качества.

По поводу гербария, то я такую терминологию уже использую, спасибо, что поддержали идею

Форум по трейдингу, автоматическим торговым системам и тестированию торговых стратегий

Собираю команду для развития МО (Дерева решения/леса) применительно к трендовым стратегиям

Aleksey Vyazmikin, 2018.06.27 16:42

Немного о направлениях, которые мне видятся перспективными:

1. Работы над генетическими методами - тут хочу попробовать создавать логические группы фич, в том числе при засеивании и взращивании потомства.

2. Работа над фитнес функциями - тут необходимо обеспечить обратную связь с фактическими результатами торговли, а не только результатами классификации.

3. Работа над взращиванием с пеньков - полуавтоматический метод генерации деревьев, когда известно основание дерева или когда известны отдельные ветви.

4. Работа над методом оценки получившегося дерева.

5. Работа над удобным и быстрым способом интеграции дерева в алгоритм советника.

6. Работа над созданием гербария - методом вытаскивания отдельных правил для создания лесов.

7. Работа над методом построения дерева не исключающим пределы/диапазоны, а старающимся дать решения всем значениям в предикторе (актуально, когда в подготовке предиктора уже используется квантование (разбитие на подгруппы)).


 

Разобрался немного с рисованием графиков, теперь модельки, предварительно отобранные по условию скриптом, могу быстро посмотреть визуально, пока решил сохранять только графики вне обучения.

Это гифка, но у меня показывает кадры только при нажатии на неё - не знаю в чем причина...