Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2741

 
JeeyCi #:

... размер окна - тоже плавающий

ML не дотягивает до подходящего инструмента именно потому что

ML faces distinct challenges in the RL context where the data is generated by the interaction of the model with the environment using a (possibly randomized) policy

т.е. сначала надо смоделировать environment текущий, и уж потом fs в нём и соответствующее поведение там же, т.е. actor должен иметь state -- на этом и можно сделать переключение на новое окно (aka учесть плавающий размер окна) и значит на новую политику среды и соответствующее/новое поведение в ней самого actor'a... вобщем, Deep Reinforcement Learning , вероятно, больше подходит, в котором

To train a trading agent, we need to create a market environment that provides price and other information, offers trading-related actions, and keeps track of the portfolio to reward the agent accordingly.

пример - тут и теория игр (взаимодействие actor'a со средой) и теория информации (касательность информации предпринимаемым ответам actor'а и реакциям среды, т.е. формирующимся новым условиям среды, aka последствия)... - я, кстати, не поняла, что СанСаныч Фоменко имел ввиду под  термином теория информации ... или опять его тезис не так читают?

p.s. сама пример не тестила...

machine-learning-for-trading/22_deep_reinforcement_learning at main · stefan-jansen/machine-learning-for-trading
machine-learning-for-trading/22_deep_reinforcement_learning at main · stefan-jansen/machine-learning-for-trading
  • stefan-jansen
  • github.com
Reinforcement Learning (RL) is a computational approach to goal-directed learning performed by an agent that interacts with a typically stochastic environment which the agent has incomplete information about. RL aims to automate how the agent makes decisions to achieve a long-term objective by learning the value of states and actions from a...
 
JeeyCi #:

куда уж внимательнее, если caret, действительно так расшифровывается

Там написано  classDist {caret}, т.е. указана конкретная функция, входящая в ПАКЕТ  caret

Как я понимаю, Вы не владеете R. Тогда, зачем Вы тратите время на этой ветке, и вообще на МО?

Без владения R обсуждение МО бессмысленно.

 
Aleksey Nikolayev #:

Вроде бы у вас видел какие-то намёки на применение survival analysis. 

Сам не занимался, но как-то задал аналогичный вопрос. Мне кажется перспективным этот подход, но уж совсем из другой оперы.

 
СанСаныч Фоменко #:

Там написано  classDist {caret}, т.е. указана конкретная функция, входящая в ПАКЕТ  caret

Как я понимаю, Вы не владеете R. Тогда, зачем Вы тратите время на этой ветке, и вообще на МО?

Без владения R обсуждение МО бессмысленно.

про entropy я промолчала лишь потому, что cross-entropy это стандартная loss-функция для моделей классификации... MO реализовано не только в R! (зная одну библиотеку и не зная природы сущностей, которыми она оперирует, - идёте без понимания направления своего движения)

к вам ещё более сложный вопрос - зачем вы категорически открещиваетесь от статистики, когда заявляете о "теории информации"?.. в то время, как она, создавалась именно как

Область находится на пересечении математики , статистики , информатики , физики , нейробиологии , информационной инженерии и электротехники .

действительно, дискусс беспредметен, если оперировать урывками и своим самомнением (да ещё и о ком-то, не только о себе), а не предметом диалога... ветка не меняется, к сожалению (конкретики и предметности в ответах не добавляется)
 
Maxim Dmitrievsky #:
Опять этот косноязычный глашатай взывает всех к истине, но пока не определился к какой 

Ты уже настолько утомил модератора, что он сносит все подряд

Не читайте провокационный пост пользователя JeeyCi (этот его пост - это провокация и требование "продолжения банкета").
Я вчера удалил несколько постов с ругательствами и хамством с переходом на личности, руководствуясь этим -

Я сделал два предупреждения в ветке, они были проигнорированы, и потом удалил несколько постов с ругательствами.
Там единственный литературный пост был (который вообще можно было читать) - это ваш пост - этот (с которого все вчера и началось):

Форум по трейдингу, автоматическим торговым системам и тестированию торговых стратегий

...

Maxim Dmitrievsky, 2022.09.10 12:15

Есть model based, model agnostic и mixed feature selection. Если брать агностик, то это корреляция и взаимная информация (entropy based). Вторая отличается от первой возможностью захватывать нелинейные зависимости, в остальном это то же самое. Сложно говорить о каком-то отношении признака к целевой в этом случае, даже невозможно. Это просто корреляция. Но полезно для того, чтобы избавиться от неинформативных фичей.

Хоть вы в скользящем окне это делайте, хоть в ускользающем, хоть в трущемся

Если вы хотите именно причинность определить, то это causal inference, в том числе с помощью МО, который я не знаю как прикладывать ко временному ряду, не изучал тему.

А все предыдущие способы не работают на поиск причинности, а только на оптимальное обучение алгоритмов.

Так что граждане снова не могут сосредоточиться и вытащить мух из своих котлет.

Про великий и всемогущий R мы уже неоднократно слышали. Очевидно, что если за него посадить обезьяну, то она тоже сможет считать себя статистиком и аналитиком, настолько он великолепен. 

Да, буду иногда удалять ругательства, особенно  в случае, если они длятся пол дня и на два листа текста например (как вчера).

----------------

Ветка эта очень популярна (её даже на англоязычном форуме читают и считают ключевой веткой по этой тематике).
Поэтому просьба - поменьше ругаться.

 
mytarmailS #:

Если проанализировать ТС более мение успешных трейдеров , то вы увидите что все они торгуют уровни.

Я не видел  ниодного успешного трейдера который торгует с помощью индикаторв  те ВР концепцию..

Уровень  - это четкая понятная точка входа ,с понятным стопом те риском..

Если можно торговать с малым риском то больше ничего и не надо, малый риск на сделку/точный вход это самое главное!

С помощью МО можно искать уровни ПД/СП те точные входы, это не тривиально, не просто, об этом не почитаешь в бложиках про МО тут свою голову включать надо..

На графике сб тоже можно начертить уровни и это тоже временной ряд. Все, ты всем надоел, больше на тебя не реагируем. Петросянишь изо дня в день.
 
mytarmailS #:

Вот пример на рандомно сгенерированой выборке 5 признаков и 1 бинарная целевая

для фореста и для фиче-селектора

Немного разгрузилась очередь заданий - появилась возможность запустить скрипт. Запускаю и получаю ошибку.

> install.packages("randomForest")
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Installing package into ‘C:/Users/S_V_A/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Warning in install.packages :
  package ‘randomForest’ is not available (for R version 4.0.5)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/bin/windows/contrib/4.0:
  cannot open URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/PACKAGES'

> library(randomForest)
Error in library(randomForest) : нет пакета под названием ‘randomForest’

Я правильно понимаю, что программа хочет старую версию R 4.0?

Ну в общем я поискал старую версию и не нашел. Ужасная несовместимость отталкивает конечно.

 
Aleksey Vyazmikin #:

Немного разгрузилась очередь заданий - появилась возможность запустить скрипт. Запускаю и получаю ошибку.

Я правильно понимаю, что программа хочет старую версию R 4.0?

У меня R-3.6.3

Это я пишу на старом  R-3.6.3  , по своим причинам, так что это из за меня проблемы..

Что то даже не мог представить что пакет удалят из кран..

Aleksey Vyazmikin #:

Я правильно понимаю, что программа хочет старую версию R 4.0?

правильно 

Aleksey Vyazmikin #:

Ну в общем я поискал старую версию и не нашел. Ужасная несовместимость отталкивает конечно.

Слушай может тебе в трейдинг нельзя, с такой то смикалкой ?? ))

С совместимостью там все отлично как раз, питону например только завидовать такой совместимости..


так же смотри

https://stackoverflow.com/questions/62541885/package-randomforest-is-not-available-for-r-version-4-0-2

пробуй на текущей версии

urlPackage <- "https://cran.r-project.org/src/contrib/Archive/randomForest/randomForest_4.6-12.tar.gz"
install.packages(urlPackage, repos=NULL, type="source") 

 
Подытоживая теорию Саныча (поскольку он сам не смог нормально формализовать и привести примеры):

*его способ отбора признаков основан на корреляции, поскольку «отношение» и «связь» это определения корреляции.

*таким способом делаем неявную подгонку под историю, похоже по смыслу на LDA (линейный дискриминантный анализ) или PCA, упрощаем процесс обучения, снижаем ошибку

*нет никакой даже теории, что обученная модель при этом должна работать лучше на новых данных (не участвовавших в оценке связей фичей с целевыми), потому что признаки были перед этим подогнаны под трейн или (что хуже) подо всю доступную историю

*ситуацию немного выправляет усреднение КК в скользящем окне, типа можно оценить разброс и выбрать более стабильные. Хоть какая-то статистика, на которую можно опереться

*под отношением я понимал причинность или статистически значимую связь, но в его подходе это не так
 
Maxim Dmitrievsky #:
Подытоживая теорию Саныча (поскольку он сам не смог нормально формализовать и привести примеры):

*его способ отбора признаков основан на корреляции, поскольку «отношение» и «связь» это определения корреляции.

*таким способом делаем неявную подгонку под историю, похоже по смыслу на LDA (линейный дискриминантный анализ) или PCA, упрощаем процесс обучения, снижаем ошибку

*нет никакой даже теории, что обученная модель при этом должна работать лучше на новых данных (не участвовавших в оценке связей фичей с целевыми), потому что признаки были перед этим подогнаны под трейн или (что хуже) подо всю доступную историю

*под отношением я понимал причинность или статистически значимую связь, но в его подходе это не так

при всём уважении, но это не подытоживание (не дайджест или краткое изложение). Тут сквозит личное отношение и необоснованные нападки. 

можно подумать что у кого то есть обоснованная теория где "обученная модель должна работать на новых данных" :-) ещё и подтверждаемая..ога