Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2857

 
mytarmailS #:

Нужна модель, уже рабочая

Т.е., если уже есть работающая стратегия, можно попробовать её улучшить за счет МО и других данных. Что-то вроде умного фильтра.

Но там сразу в полный рост встанет вопрос натягивания алгоритма на данные.

Хотя, это хороший вариант.  С этой стороны никогда не думал.

 
Andrey Miguzov #:

Но там сразу в полный рост встанет вопрос натягивания алгоритма на данные.

В этом варианте улучшаеться рабочее (кашу маслом не)

А в общепринятом подходе натягиветься алгоритм на рынок и настройки на алгоритм, те полная подгонка всего со всем , а МО это запросто может, столько минимов функции найдет что и тест хороший будет и трейн пройдет и валид.. вот только тест реальностью не пройдет..


Также интерисуюсь созданием  "сложных правил" через фитнес функцию , это глобальный поиск, но есть много нюансов..

 
Andrey Miguzov #:

Проблема МО (в трейдинге) в том, что в итоговом варианте эксперта, скорее всего, не останется МО.

Не могу согласится. Базовая стратегия + модель МО + ММ - примерно так выглядит в моём понимании модель советника, при это в МО могут входить даже отдельные листья деревьев.

Andrey Miguzov #:

Я веду к тому, что может лучше:

1. Выделить из данных действительно важные. Прям вот которые точно-точно влияют. 

2. Понять почему они важны (оказывают влияние на движение цены). Если реальных причин, почему эти данные оказывают влияние на цену нет - скорее всего это просто совпадение.

3. Опираясь на п.2 написать ТС, которая использует данные из п.1. Долго её отлаживать в тестере, смотреть каждую сделку. Потом на реале, видя реальные сделки и глюки, которые в теории и в тестере учесть было просто не реально.


Во 2 и 3 шаге МО будет только мешать. 

1. Да, такие можно выявить. При этом чаще всего пропустим те, что имеют сложную структуру, к примеру даже такие правила "В четверг в 16 часов продаем, если дневной бар растущий".

2. Что значит "реальные причины" - тут не понятно.

3. Любая стратегия имеет неблагоприятные периоды, которые могут быть затяжными, поэтому нужно иметь зоопарк таких стратегий, а создать его в ручном режиме - или быть гением, либо жить очень долго. Я как раз занялся МО после разработки такой гениальной стратегии, на которую ушло примерно два года, и каждый её чих я логически мог обосновать, а когда поставил её в работу то как раз попался неблагоприятный для неё период, который на подогнанных данных в тестере был сглажен.

Возвращаясь ко второму пункту - я ищу возможность найти схожесть поведения бинарных предикторов, которые продолжат быть эффективными в обозримом будущем. Для этого хочу выделить специфичные предикторы. Я допускаю, что нужно учитывать цикличность связей между предикторами, что не делает любая из известных мне моделей на автомате.

 
Aleksey Nikolayev #:

Ну есть же приближение кривой сплайнами. Нужно взять сплайны первого порядка (ломаная). Потом отобрать нужные отрезки.

Это Вы про интерполяцию сплайнами? Никогда так не делал.

Первого порядка - это разве не прямая будет между двумя точками - эх темнота я.

И, как определить опять же "нужные отрезки", которые следует отобрать?

Aleksey Nikolayev #:

Чем ближе к концу, тем меньше значимость уровня из-за того, что на них приходится всё меньшая доля выборки. Растёт вероятность того, что просто случайный артефакт.

Интересно всё же понять, от чего зависит размер отрезка ЗЗ.

Я вообще считаю, что есть закономерность относительно предпоследнего отрезка..

 
Aleksey Nikolayev #:
Сейчас же главная тема в МО - ChatGPT. Может даже писать советники) Говорят, что будет гораздо полезнее гугла.

разве главная? по моему игрушка, всякую Черниговщину генерит

Тут как бы без вариантов, новых знаний из нее не получить, путём обобщения чего она там запомнила 

поисковые движки тоже сейчас на нейросетях, и дают более релевантную инфу

 
Aleksey Vyazmikin #:

Это Вы про интерполяцию сплайнами? Никогда так не делал.

Первого порядка - это разве не прямая будет между двумя точками - эх темнота я.

Советую почитать Тибширани со страницы 295.

Aleksey Vyazmikin #:

И, как определить опять же "нужные отрезки", которые следует отобрать?

Это определяется решаемой задачей. Например, можно попытаться взять все отрезки в качестве предикторов - каждый отрезок задаётся двумя числами (Х начала и коэффициент наклона).

Aleksey Vyazmikin #:

Интересно всё же понять, от чего зависит размер отрезка ЗЗ.

Я вообще считаю, что есть закономерность относительно предпоследнего отрезка..

Вполне возможно. Может влиять и предпредпоследний и отношение сумм высот колен разных направлений, наличие новостей и тд и тп.

 
Maxim Dmitrievsky #:

поисковые движки тоже сейчас на нейросетях, и дают более релевантную инфу

Вроде гугл уже напрягся из-за этой штуковины. Пока она его не заменяет, но его перспективы стали более туманными.

Maxim Dmitrievsky #:

разве главная? по моему игрушка, всякую Черниговщину генерит

Тут как бы без вариантов, новых знаний из нее не получить, путём обобщения чего она там запомнила 

Поисковики тоже ничего не генерят, но без них в интернете никак, а эта штуковина - следующий этап в их развитии. Уже пишут с её помощью несложные ТС на питоне, а со временем перейдут и к более продвинутым.

 
Aleksey Nikolayev #:

Вроде гугл уже напрягся из-за этой штуковины. Пока она его не заменяет, но его перспективы стали более туманными.

Поисковики тоже ничего не генерят, но без них в интернете никак, а эта штуковина - следующий этап в их развитии. Уже пишут с её помощью несложные ТС на питоне, а со временем перейдут и к более продвинутым.

Попробую написать ТС на питоне с помощью, заинтересовали 😀 впрочем уверен, что это будет смешно. Вставить пару-тройку сниппетов будет куда быстрее и надежней. 

Гугл обучается каждый день, индексирует новые страницы. И видели какие у них сервера так-то? А гпт 2 года назад обучили вроде?

И тест Тьюринга проходит должна, иначе просто развлекуха
 
Aleksey Nikolayev #:

Уже пишут с её помощью несложные ТС на питоне, а со временем перейдут и к более продвинутым.

Что то не нашёл в гугле про это.. 
Разве что про фундаментальный анализ,  но наверное не это имелось в виду
 
Maxim Dmitrievsky #:
Попробую написать ТС на питоне с помощью, заинтересовали 😀 впрочем уверен, что это будет смешно. Вставить пару-тройку сниппетов будет куда быстрее и надежней. 

Гугл обучается каждый день, индексирует новые страницы. И видели какие у них сервера так-то? А гпт 2 года назад обучили вроде?

И тест Тьюринга проходит должна, иначе просто развлекуха

Поисковик должен просто искать, а эта штука генерит оригинальный текст. Делает это пока не особо хорошо, как-то обтекаемо что ли. Попросил решить уравнение не имеющее решений (по теореме Ферма) и она "нашла" решения подправив уравнение и "не заметив" требования положительности) Но с ней же можно продолжить диалог и она в итоге признала ошибку) Когда же спросили то же самое с прямым указанием использовать теорему Ферма, то сразу сказала что нет решений)

Лень пока возиться с этой штуковиной, да и доступа нет - в России сложно получить, нужно повозиться.