Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3060

 
Aleksey Vyazmikin #:

А какой Вы увидели смысл от этих изысканий для трейдинга?

вам придется перевести их маркетологовские определения на нормальный человечий язык, чтобы придумать как прикручивать

если грубо: есть группа трейн с уже тритментом в виде обученной модели допустим, есть тест (контрольная группа) без тритмента. Все остальные выводы и uplift модели делается по предложенным методам. может это не совсем корректная аналогия.

Посмотрите на это проще: вы делаете любой тритмент (причина) и потом анализируете следствия через всякие рандомизированные тесты. Получается причинно-следственный анализ. 

 
Maxim Dmitrievsky #:

вам придется перевести их маркетологовские определения на нормальный человечий язык, чтобы придумать как прикручивать

если грубо: есть группа трейн с уже тритментом в виде обученной модели допустим, есть тест (контрольная группа) без тритмента. Все остальные выводы и uplift модели делается по предложенным методам. может это не совсем корректная аналогия.

Посмотрите на это проще: вы делаете любой тритмент (причина) и потом анализируете следствия через всякие рандомизированные тесты. Получается причинно-следственный анализ. 

Возможно, я действительно не понял цели этого всего... Но, мне показалось, что целью является именно выявление влияния нового фактора или можно представить как выброс прошлого значения предиктора, на показатель (цена там или чего ещё - регрессия в основном в примерах). Тогда задачей должно стоять детекция этих выбросов при неизменной хронологии событий (нельзя рандомить строки выборки для временных рядов). И, получается, что это редкое событие, или разовые изменения. Тогда достаточно смотреть на изменения распределения показателя предиктора за взятое фиксированное временное окно. Те предикторы, у которых фиксируется такое изменение, являются причиной (а может и нет - тут я не понял их мысль как определить причина это или следствие), и если эти изменения на разных участках тестирования чаще приводят к эффекту "модель не работает", то нужно заставить модель внимательней работать с этими предикторами...

 
Aleksey Vyazmikin #:

Возможно, я действительно не понял цели этого всего... Но, мне показалось, что целью является именно выявление влияния нового фактора или можно представить как выброс прошлого значения предиктора, на показатель (цена там или чего ещё - регрессия в основном в примерах). Тогда задачей должно стоять детекция этих выбросов при неизменной хронологии событий (нельзя рандомить строки выборки для временных рядов). И, получается, что это редкое событие, или разовые изменения. Тогда достаточно смотреть на изменения распределения показателя предиктора за взятое фиксированное временное окно. Те предикторы, у которых фиксируется такое изменение, являются причиной (а может и нет - тут я не понял их мысль как определить причина это или следствие), и если эти изменения на разных участках тестирования чаще приводят к эффекту "модель не работает", то нужно заставить модель внимательней работать с этими предикторами...

Предикторы и тритмент это разное. Каузал работает с outcome'ами (исходами), для определения ATE (average treatment effect) если не касаться признаков или CATE (conditional ... ...) в случае наличия ковариатов (признаков), с учетом какого-то внешнего воздействия (например рекламной кампании, которая и является тритментом). Это для определения был ли эффект от воздействия на контрольной группе. Потом, с учетом этого эффекта, можно проанализировать и улучшить вашу модель или какую-нибудь метрику.

... это вы уже пытаетесь придумать как применять то, в чем еще не разбираетесь

пройдете бесплатный небольшой вводный курс

 
Maxim Dmitrievsky #:

Предикторы и тритмент это разное. Каузал работает с outcome'ами (исходами), для определения ATE (average treatment effect) если не касаться признаков или CATE (conditional ... ...) в случае наличия ковариатов (признаков), с учетом какого-то внешнего воздействия (например рекламной кампании, которая и является тритментом). Это для определения был ли эффект от воздействия на контрольной группе. Потом, с учетом этого эффекта, можно проанализировать и улучшить вашу модель или какую-нибудь метрику.

... это вы уже пытаетесь придумать как применять то, в чем еще не разбираетесь

пройдете бесплатный небольшой вводный курс

Я прочёл две статьи этих - по ним и появились идеи в совокупности с видео.

https://habr.com/ru/companies/ru_mts/articles/485980/

https://habr.com/ru/companies/ru_mts/articles/485976/ 

Ну и я работаю над подобной задачей - поэтому своё виденье нюансов. А так да - терминология новая запутывает.

Вычитать вероятности предсказания моделей - ну не думаю, что в этом прок, особенно если знаешь как распределены эти вероятности в CB.

Будите экспериментировать с библиотеками специализирующимися на данных вопросах - делитесь результатами и видиньем ситуации.

Пока главная идея у них проскальзывает в подходе - главное - опыт и знания аналитика о предмете анализа :)

 
Aleksey Vyazmikin #:

Я прочёл две статьи этих - по ним и появились идеи в совокупности с видео.

https://habr.com/ru/companies/ru_mts/articles/485980/

https://habr.com/ru/companies/ru_mts/articles/485976/ 

Ну и я работаю над подобной задачей - поэтому своё виденье нюансов. А так да - терминология новая запутывает.

Вычитать вероятности предсказания моделей - ну не думаю, что в этом прок, особенно если знаешь как распределены эти вероятности в CB.

Будите экспериментировать с библиотеками специализирующимися на данных вопросах - делитесь результатами и видиньем ситуации.

Пока главная идея у них проскальзывает в подходе - главное - опыт и знания аналитика о предмете анализа :)

инструментарий предложен, разбирайтесь

если слишком абстрактно мыслить, то все работают над "подобной задачей" (только не могут сформулировать над какой конкретно)

 
Maxim Dmitrievsky #:

инструментарий предложен, разбирайтесь

если слишком абстрактно мыслить, то все работают над "подобной задачей" (только не могут сформулировать над какой конкретно)

У меня ветка отдельная на форуме по решению задачи. Цель - как раз установить появится новый фактор, влияющий на распределение вероятности предиктора (квантового отрезка) или нет.

Хотя давно не работал над ней. Точней, надо идеи с бумаги перенести в код.

Мне трудно с таким разобраться без базовых знаний питона или эр. Совсем нет времени свободного и быстро устаю. Хотя таблетки несколько помогли - но я пью их по настраению...

Автоматический расчет описательных статистик выборки на MQL5 - Определите, похожи ли в целом средние значения событий?
Автоматический расчет описательных статистик выборки на MQL5 - Определите, похожи ли в целом средние значения событий?
  • 2023.03.24
  • www.mql5.com
Код использует два callback-объекта в обучении модели LearningRateScheduler - позволяет динамически изменять скорость обучения модели в зависимости от номера эпохи. За весь период наблюдения поворот направо был осуществлен в 65
 
Aleksey Vyazmikin #:

У меня ветка отдельная на форуме по решению задачи. Цель - как раз установить появится новый фактор, влияющий на распределение вероятности предиктора (квантового отрезка) или нет.

Хотя давно не работал над ней. Точней, надо идеи с бумаги перенести в код.

Мне трудно с таким разобраться без базовых знаний питона или эр. Совсем нет времени свободного и быстро устаю. Хотя таблетки несколько помогли - но я пью их по настраению...

Надо ставить задачи по силам. Нет никакой возможности вникать что там написано. Частота имеет временную шкалу.. слишком откровенно. дальше палец рефлекторно ткнул крестик ❌
 
Maxim Dmitrievsky #:
Надо ставить задачи по силам. Нет никакой возможности вникать что там написано. Частота имеет временную шкалу.. слишком откровенно. дальше палец рефлекторно ткнул крестик ❌

Да, именно временную шкалу я взял, только так можно стандартизировать независимые показатели в той выборке, да и прикладное значение не теряется.

Согласен, что задача сложная, и может и решение не будет мной найдено. Однако, я вижу, что это основная причина, почему модели перестают работать - сильно меняется распределение смещения вероятности в диапазоне предиктора со временем. И тут либо искать причину, почему это происходит - детектировать момент появления нового фактора, либо искать предпосылки к изменчивости из истории "жизни" - некая задача на выживание.

Если смотреть на Ваш подход, через эти знания, то Вы косвенно ищите на периоде обучения как раз участки, где распределения имеют стабильность для значимых в тот момент предикторов, отсеивая другие участки с другим распределением по каким либо критериям. Однако от того, что для разных предикторов эти участки в выборке разные - отсеивается очень большой период выборки. Попробуйте уменьшать число предикторов на каждой итерации - это снизит конфликт смещения вероятности между предикторами, а значит сможет увеличить Recall.

 
У частоты нет временной шкалы. Я просто работаю с ошибками модели :) этот подход озвучил уже давно, не знал про uplift техники. Оказалось, что сделал примерно то же самое. Какой толк смотреть на эти распределения? Визуализация того, что и так понятно.
 
Maxim Dmitrievsky #:
У частоты нет временной шкалы. Я просто работаю с ошибками модели :) этот подход озвучил уже давно, не знал про uplift техники. Оказалось, что сделал примерно то же самое. Какой толк смотреть на эти распределения? Визуализация того, что и так понятно.

Может я не прав с термином, как ещё назвать периодичность события за отведенный момент времени?

Я не говорю о визуализации... а говорю о том, как эффективней работать с этой проблемой.