Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1744

 
Vladimir Perervenko:

2. Лучший результат с ансамблем ELM - Acc=0.8+-0.1. Обработка шумовых примеров обязательна. Ее можно проводить не только с noisefilter.

Ну смотрите, вот результат xgboost 

зигзаг, классификация, евра часовик , без удаления шумовых примеров,  предикторы  (pca  и индикаторы)  , никакой подготовки данных, просто все в кучу и вперед

ошибка на OOS 

[1] "Final Accuracy = 77.16%"

Так что деревья тоже неплохие , а если еще шумы по удалять...

Vladimir Perervenko:

 Accuracy не самый важный показатель качества для ТС. Для наших задач более важно иметь максимальную величину среднего вознаграждения на бар на конкретном отрезке времени.

А как это можно выразить в виде целевой переменной ?


Vladimir Perervenko:

3. Дискретизация убирает проблему выбросов, делает связь предикторов с целевой более линейной. Но значимого улучшения качества классификации я пока не получил. Продолжаю в этом направлении копать. Появилось много новых техник.

Главное чтобы ухудшений не было, лично мне дискретизация нужна для превращения в категориальные данные желательно без потери информации. Это все нужно опять таки для построения правил

Vladimir Perervenko:

4. Не понимаю почему Вы увязли в простом лесу.

Я увяз скорее в решающих правилах в общем.. Вам интересно исследователь модели я так понимаю, у меня же душа лежит к исследованию самого процесса, а там нужна интерпретируемость.

В  "стандартном обучении" которое делаете и вы и (99.9% других) есть изъян по отношению к рынку.

Под   "стандартном обучением" я имею ввиду что данные представляются  в виде матрицы  (строка это набор обучения с меткой класса), и ничего кроме строки матрицы эта модель не видит.

Если представить что рынок это событийная модель , а я уверен что так и есть, то давайте смоделируем некую ситуацию.


если   событие 1   потом   событие 2  потом   событие 3   тогда    Y == 1

Как вы видите это правило ))) (это еще один ответ почему я увяз в правилах)

Что если   событие 1 произошло наделю назад ,   а событие 2 вчера ? 

Что если   событие 1 может произойти и  неделю назад и 5мин назад те не регулярно , и так с каждым событием, те главное чтобы события произошли и в правильной последовательности.

Никогда никакой АМО не найдет этих закономерностей, когда данные у него в виде матрицы данные в которой построены методом скользящего окна

Так вот о чем это я, а .. Как можно искать закономерности которые происходят с не регулярным временным диапазоном? 

Вот мои попытки найти что то что должно попытаться ответить на эти вопросы


поиск ассоциативных правил  - пакет arules

Можно находить такие правила с которыми ассоциируется Y и неважно в какой последовательности эти правила происходили

 поиск ассоциативных последовательностей правил arules seqence

Можно находить такие правила с которыми ассоциируется Y но с учетом  последовательности этих правил

Глубокий анализ и кластеризация последовательностей TraMineR

Генетическая генерация правил SDEFSR

Суть в пакете не прогноз Y , а объяснить ее, те алгоритм пытается объяснить какие события должны произойти в обучающей матрице что бы появилось Y


Эти все подходы в теории должны значительно расширить потенциал наших текущих возможностей по прогнозированию

И как вы видите все они базируются на логических правилах)

 
MrBobr1:
Интерессная тема. Я хоть и не матиматик и далек от машинного обучения, но вижу в чем проблема. И знаю как ее решить. Не возможно создать самообучающую систему, если не понятно, когда рынок начнет движение, начнет ли вообще, а если начнет когда оно закончится, и можно ли на этом движении заработать.  Нужно создать работающую модель, то есть уже прибыльную систему заложить. А уже отталкиваясь от нее задать алгоритм сравнения и улучшения системы. Я пошел этим путем и создал простой алгоритм, правда для ручной торговли. Интерессно посмотрите тему Как увеличить счет в 1000 раз. https://www.mql5.com/ru/forum/330313

посмотрел пол ветки , так и не понял в чем суть )

 
mytarmailS:

посмотрел пол ветки , так и не понял в чем суть )

суть там единичный прогон имеет вероятность отличную от ансамблевого и может быть любым. 

 
mytarmailS:

посмотрел пол ветки , так и не понял в чем суть )

Все просто. Не надо пытаться понять весь рынок. И не надо доверять роботу искать эти закономерности на всем рынке. Возьмите только какую то малую часть рынка. И доверьте роботу искать закономерности, только в аналогичных частях рынка. Или сами найдите эти закономерности. На рынке есть ситуации, когда вероятность заработать гораздо больше чем потерять. Так и есть ситуации, когда лучше не лезть в рынок. И таких ситуаций большинство. Так вот возьмите только эту часть рынка, а все остальные движения игнорируйте, и создайте алгоритм торговли.

 
mytarmailS:

посмотрел пол ветки , так и не понял в чем суть )

Это примерно, как прочитал пол книги и ничего не понял.  Некоторым  удавалось в сотни раз увеличить счета, а мне неоднократно в десятки раз, а один автор написал в ветке, что ему удалось в 1000 раз увеличить. Значит, закономерности на рынке есть.  Вот с этими закономерностями и надо работать. https://www.mql5.com/ru/forum/330313


Как увеличить счет в 1000 раз.
Как увеличить счет в 1000 раз.
  • 2020.01.12
  • www.mql5.com
Как увеличить счет в 1000 раз. Мне удалось пройти почти половину пути к этой цели. Результат счет за четыре месяца удалось увеличить в 28 раз...
 
MrBobr1:

Все просто. Не надо пытаться понять весь рынок. И не надо доверять роботу искать эти закономерности на всем рынке. Возьмите только какую то малую часть рынка. И доверьте роботу искать закономерности, только в аналогичных частях рынка. Или сами найдите эти закономерности. На рынке есть ситуации, когда вероятность заработать гораздо больше чем потерять. Так и есть ситуации, когда лучше не лезть в рынок. И таких ситуаций большинство. Так вот возьмите только эту часть рынка, а все остальные движения игнорируйте, и создайте алгоритм торговли.

Так мы тут этим и занимаемся, только на другом уровне...

Вот например алгоритм --  решающее дерево или  desing tree

Что это ?

Это логическое правило,  те можно считать что это выделение некого участка , части рынка ,или можете представить что это микро торговая  система под именно этот участок рынка. Потом мы идем еще дальше и складываем много таких правил(микросистем) иногда тысячи  в один  , это уже будет алгоритм форест

 
MrBobr1:

Все просто. Не надо пытаться понять весь рынок. И не надо доверять роботу искать эти закономерности на всем рынке. Возьмите только какую то малую часть рынка. И доверьте роботу искать закономерности, только в аналогичных частях рынка. Или сами найдите эти закономерности. На рынке есть ситуации, когда вероятность заработать гораздо больше чем потерять. Так и есть ситуации, когда лучше не лезть в рынок. И таких ситуаций большинство. Так вот возьмите только эту часть рынка, а все остальные движения игнорируйте, и создайте алгоритм торговли.

не, не найдет
 
MrBobr1:

Это примерно, как прочитал пол книги и ничего не понял.  Некоторым  удавалось в сотни раз увеличить счета, а мне неоднократно в десятки раз, а один автор написал в ветке, что ему удалось в 1000 раз увеличить. Значит, закономерности на рынке есть.  Вот с этими закономерностями и надо работать. https://www.mql5.com/ru/forum/330313

Посмотрел и не понял потому что так и не увидел четкого алгоритма действий, да и не четкого тоже не увидел, вообще никакого не увидел, только картинки и посты с 1000% в них

 
mytarmailS:

Посмотрел и не понял потому что так и не увидел четкого алгоритма действий, да и не четкого тоже не увидел, вообще никакого не увидел, только картинки и посты с 1000% в них

к тому же мартин. риск слива более 3/4 вероятность выиграша менее 1/15. Есть статья про 300 лет не той реальности, единичная и ансамблевая вероятность, ансамблевая стремится к матожиданию, одиночная может быть любой. То бишь есть вероятность стремящаяся к нулю, что решка выпадет бесконечное число раз минус один, конечное число раз конечно. После 100 решек орел имеет вероятносто 1/2.

 
mytarmailS:

Посмотрел и не понял потому что так и не увидел четкого алгоритма действий, да и не четкого тоже не увидел, вообще никакого не увидел, только картинки и посты с 1000% в них

Если кому то неверите на слово, попросите прислать ссылку на мониторинг. Я вам свои выслал. Другие то же наврное вышлют, что жалко что ли.