Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3131

 
Aleksey Vyazmikin #:

Золотой стандарт

На предыдущем занятии мы рассмотрели, почему и чем ассоциация отличается от причинно-следственной связи. Мы также увидели, что требуется для того, чтобы ассоциация стала причинно-следственной связью.

E|Y|T = 1] - E[Y|T = 0] = E[Y - Yo|T = 1] + {E[Yo|T = 1] - E[Yo|T = 0]} СМЕЩЕНИЕ ATT

Напомним, что ассоциация становится причинно-следственной связью, если нет предвзятости. Смещения не будет, если E[Yo T = 0] = E[Yo T = 1]. Другими словами, ассоциация будет являться причинно-следственной связью, если обработанный и контрольный пациенты равны или сопоставимы, за исключением их лечения. Или, говоря более техническим языком

Выше перевод картинки.

Для начала - я не могу понять, в какой точке Вы хотите разделять выборку на две подвыборки.

Далее - видимо тут особая терминология, причинно-следственная связь - это непосредственное влияние на результат - пожалуй, даже уже не вероятностная закономерность. Ассоциативная связь - это либо активатор причины, либо сопутствующий признак, и как правило имеет вероятностное значение.

Формулу я не понимаю - изложите человеческим языком суть?

Но, речь в этих методах (АпЛифт) идёт об оценке фактора, который исключительно повлиял на целевую. Я так понимаю, оценивается степень влияния. И, допустим, в нашем случае мы такой фактор не знаем и перебираем всё подряд - на выходе получаем какие то измерения. И, что с ними делать предлагаете? Плохие показатели исключить?
Как это использовать при постепенном дрейфе данных?

Не исключаю, может, Вы нечто гениальное придумали, но я пока не уловил ход мысли.

можете у чатгпт спрашивать расшифровку формул, если символы непонятны какие-то.

Y|T = 1  исходы тестовой группы (с тритментом)

Y|T = 0 - контрольной (без)

Y - метка класса, Y0,Y1 - метки классов без тритмента и с ним

T - тритмент внесли в модель ( в т. ч. предиктор) или не внесли (1;0)

E - матожидание

Разделение в любой точке, как делите на тест и трейн

Если не делаете перемешивание, то получается смещенная оценка ATE+bias

ATE - средний лечебный эффект от воздействия

сонный, могу буквы местам перепутать, но логика должна быть понятной

 

кстати, bard от Гугла больше нравится чем gpt. Он умеет гуглить и бесплатный.

но поддерживает только англ язык и vpn сша или англии, в других странах не работает.

ну и в принципе кто такие openAI и кто такие гуглы. Наверное разные весовые категории.
 
Maxim Dmitrievsky #:

кстати, bard от Гугла больше нравится чем gpt. Он умеет гуглить и бесплатный.

но поддерживает только англ язык и vpn сша или англии, в других странах не работает.

ну и в принципе кто такие openAI и кто такие гуглы. Наверное разные весовые категории.
Я едж юзаю , никаких впн и  тоже гуглит и все языки
 
Исследую методом тыка, что подать на вход нейросети. Раз у вас нет готового продукта ни у кого в маркете, выскажусь:

Чисто наблюдение: если подавать на вход что-то, что описывает график цены без привязки к строгой временной хронологии, то результаты как будто живее что-ли. То есть, если подавать на вход цены N+1,  N+2,  N+3... то получается какая-то дичь, идеальный хаос 50 на 50 во всём его проявлении. 

А если подавать на вход что-то вроде N+1, N+6, N+17... построенное по каким-то конкретным правилам (например графический паттерн), то результаты как будто подают признаки жизни, как будто пациент жив, но в коме. 

Следующий момент: целевая. Если её описывать как "следующая свеча такая то, жри нейросеть и обновляй веса", то опять же - на выходе полный рандом. Если же описывать будущее в не зависимости от той же хронологии и ставить метки по какому-нибудь правилу типа "дальше мне нравится график, тута +1 однозначно, жри нейросеть и обновляй свои веса".

Если соединить оба метода, на вход переменный тайфмфрейм и на целевую переменный таймфрейм, то результаты иногда заводятся ненадолго (пациент в коме, но дёргает рукой). Например, если обучать данными за 2021 год, то почти весь 2022 может быть в +, а при строгой хронологии вход/таргет - болтанка рандомная. Но, тот же 2020 не поддаётся, после него 2021 хаотичный. Получается, переменные данные захватывают некоторые рабочие паттерны и могут ими поторговать, а строгая хронология ломает форвард сразу. 


Статью ещё читал, древнюю, как мамонт, она ещё живая на домене народ.ру, там дядька пишет, что если взять приращение строгой хронологии и чёто как-то там сравнить с прошлым, что корреляция 0. А если взять данные, описывающие график цены без строгой привязки к порядку, то корреляция с прошлым доходит дор 0,8.  Делает вывод: ценообразование внутри свечи случайное и не поддаётся прогнозированию. Ценообразование на неопределённое время поддаётся прогнозированию. 
 
mytarmailS #:
Я едж юзаю , никаких впн и  тоже гуглит и все языки
У меня мак, лень с эджом заморачиваться 
 
Ivan Butko #:

Что бы иследовать не методом тыка рекомендую познакомиться с  генетическим програмированием

Что бы искать закономерности не привязаные к времени/хронологии рекомендую познакомиться алгоритмами асоциавные правила


А по направлению поиска все правильно..

на рынке есть только цены и последовательность определенных событий, именно событий


 
Ivan Butko #:
Исследую методом тыка, что подать на вход нейросети. Раз у вас нет готового продукта ни у кого в маркете, выскажусь:
В какой-то из статей анализировал результаты в зависимости от фиксированного горизонта прогноза. На часовиках лучший был в районе 15 баров вперед, точнее всего угадывал направление. Но для каждого инструмента могут быть свои периоды.

Точно так же распределение прибылей по торговым часам неравномерное. В определенные часы работает лучше.
 
Еще было великолепное обсуждение с Aleksey Nikolayev, начало тут https://www.mql5.com/ru/forum/86386/page2876
До реализации я пока не добрался
 
Maxim Dmitrievsky #:
У меня мак, лень с эджом заморачиваться 

а он только для винды или что?

 
mytarmailS #:

а он только для винды или что?

У нас же санкции, сначала установить, потом через пень-колоду. Лень заморачиваться.
Причина обращения: