Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2754

 
JeeyCi #:

да, мне нравится это слово (что-то такое родное с Event-driven programming) -


Реперные точки это следствие обычно, события причины, поэтому реперные точки или области или отрезки, как следствия событий из реального мира ближе по смыслу.

Можно конечно рассматривать ценовой ряд, как отдельный мир, и в этом мире определять события, фантазируя, что события паттерны влияют на дальнейшее поведение цены, но это не так же)))

До сих пор не понимаю, почему одномерный массив это вектор, и алгебра векторная, там направление индексами массива почти никогда не используется и не несет такой смысловой нагрузки, как в обычном векторе))) Вот мучаюсь)))

 
Valeriy Yastremskiy #:

события паттерны влияют на дальнейшее поведение цены, но это не так же)))

Аргументируй

 
mytarmailS #:
Аргументируй

Не всегда, и не всегда одинаково. Есть одинаковые паттерны вызванные не одинаковыми событиями, мы же имеем суммарное не контролируемое нами воздействие. Т.е. ошибка случая будет всегда без контроля событий ФА. Поэтому не так. 

Вообще склоняюсь к идее, что целевая, это поведение решений/наших действий, на поведение цены. Функция цены мне коряво, все таки функция это нечто определенное, даже с некими вероятностями, коридорами, но с правилами и взаимосвязями.

Тискаю идею определения поведения через сетку уровней, равномерных, или уровней исторических экстремумов) Как бы надо оба подхода применять, пока решаю задачу, что надо посчитать из ряда, что бы выставить правильный шаг сетки, и как часто надо менять эту сетку)))

 
Valeriy Yastremskiy #:

Тискаю идею определения поведения через сетку уровней, равномерных, или уровней исторических экстремумов) Как бы надо оба подхода применять, пока решаю задачу, что надо посчитать из ряда, что бы выставить правильный шаг сетки, и как часто надо менять эту сетку)))

может лучше просто взять какую то сиуацию на рынке с уровнем , потом найти схожие с ней ситуации , обьединить их в группу и потом эту группу попробовать отделить от всего остального..

 
mytarmailS #:

может лучше просто взять какую то сиуацию на рынке с уровнем , потом найти схожие с ней ситуации , обьединить их в группу и потом эту группу попробовать отделить от всего остального..

Может и лучше. Это другая работа, изначально можно взять график новостей(хоть как то формализованы) и событий(надо формализовать) и погонять на одинаковые паттерны, но это уже делали и делают. Вопрос как формализовать, то что есть сегодня результатов не дает профитных. 

Профитней получается одинаковый временной промежуток тискать. 

Мне пока идея правильного определения состояния увлекает. У Саныча понравился вывод, смена поведения достаточно часто сливает депозит без предупреждения))) Свой вывод, цена меняет поведение достаточно часто и достаточно широком диапазоне и судя по всему с разными паттернами перед сменой поведения. Не могу пока более точно сформулировать, что это значит. В математике видимо, что для описания СБ необходимо бесконечное количество моделей. Для рынка, у нас пока не хватает количества моделей для достаточно точного описания.

В общем, что надо посчитать по ряду, что бы правильно посчитать шаг сетки))) И как часто менять шаг)))

ЗЫ Почему сетка, потому что это одно из самых простых вариантов контроля состояния, все что между уровнями не фиксим, переходы с уровня на уровень, тренд, возврат, значит экстремум.. Ну как бы есть траблы, но такая дубовая формализация состояния.
 
JeeyCi #:

да, мне нравится это слово (что-то такое родное с Event-driven programming) -

у озвученного варианта от СанСаныч Фоменко  -- что-то именно такое, похоже, и реализовано: выброс -> значит вход (или выход).. я там чуть выше намешала кашу из dim_reduction и ещё выше методов многомерной классификации (LDA, clustering)... но суть Махаланобиса всё равно, наверно, прежде всего всегда была в многомерном пространстве как outliers/novelty detection... поэтому вариант торговли на выбросах - очень даже ничего смотрится (только правильно feature_engineering сделать, а не тупой набор нач. данных перебирать для fs)...

но всё-равно "скользящее окно" смущает (хотя обычная авторегрессионная модель - обычна для timeseries-following-trading)... - там тоже может быть каша (в окне)... -- предполагаю, границы окна - это выход в рынок смартов, которые кстати используют в своём portfolio_management -- Mean-Variance Optimization... мы, конечно, не знаем их portfolio (лишь примерно из CoTов задним числом), но в рамках этого variance они, вероятно, и делают rebalancing своих portfolio --- пока фиксятся или загружаются об ритейл...

торговля на выбросах, конечно, интересный вариант, но учесть кто стоит против - OTF или DTF (дейтрейдеры) -- тоже важно, чтобы выброс правильно интерпретировать...

p.s.

ну, или просто брать не выбросы Махаланобисом, а крайние децили распределения предсказаний -- для risk-acceptance (vs. risk-avoidance) behavior, например, actor'a (с соотв. переключением его state'a согласно env. параметрам)

Вы все равно движетесь в скользящем окне, не важно какой оно формы и свойств и какие признаки содержит. Было бы глупо отрицать очевидное.

Пока пипл не осилит азы, общаться будет невозможно

Обучение с подкреплением завязано на то, что агент влияет на среду, за исключением простых табличных примеров. И существует конечное множество стейтов, либо политики меняются медленно и не скачками. Исходя из этого невозможно внедрить агента на Форексе, всегда будет получаться обычная классификация.

По форме это будет выглядеть типа вау, актор что-то делает в определенной среде. А по сути это не выполняется, просто классифицируются случаи. Для робототехники или игр больше подходит.

Без выполнения этого условия RL можно рассматривать как оптимизацию, одну из..
 
Maxim Dmitrievsky #:
 
Обучение с подкреплением завязано на то, что агент влияет на среду, за исключением простых табличных примеров. Исходя из этого невозможно внедрить агента на Форексе, всегда будет получаться обычная классификация.    

По форме это будет выглядеть типа вау, актор что-то делает в определенной среде. А по сути это не выполняется, просто классифицируются случаи. Для робототехники или игр больше подходит.

Без выполнения этого условия RL можно рассматривать как оптимизацию.

согласна... поэтому склоняюсь к тому, что агент - это OTF (крупняк, смарты) -- по ultra-high volume (как в стандартном VSA) -- как сдерживающие, так и пробивающие объёмы формализовать... в этом вижу основное предназначение ML в подготовке данных -- определить, что есть uhv на конкретном активе... и именно смартов расценивать, как actor'a, не дейтрейдеров... хотя, конечно, формализовать ещё надо...

 

я тут, кстати, пытаюсь полистать ваш линк по causal inference- по линку, кстати, смысл явления описан достаточно топорным русским языком... но вот линки с него на book и др. наводят на мысль, что речь идёт об исследованиях частных коэфициентов корреляции (если выразиться на русском) - т.е. при фиксированных иных факторах, кроме исследуемого... т.е. находится частный коэф.корр. (есть стат. мат. формулы в академических кругах или любой норм. книжке по стат-ке), оценивается его значимость через нулевую гипотезу (H0) и делается вывод о влиянии или невлиянии (т.е. зависимости или независимости выбранных переменных), например, на русском:

при фиксированном качестве посевного материала, мин. удобрений и фин. затрат - продуктивность посевов не зависит от фондооснащённости

т.е. фондооснащённость и продуктивность посевов - линейно НЕзависимы... (это в части interventions)...

и можно доказать это частным коэф.корр. из статистики... это как раз ситуация доказывания, что  корреляция в многофакторном пространстве не обязательно служит причинностью наблюдаемого явления... т.е. по сути стандартное Планирование эксперимента призвано решать такие задачи - избавлять логические выводы о результатах от замусоренности незначимыми фактор-результат корреляциями, которые необоснованно возводятся в ранг причинно-следственных явлений

остальное недочитала (про confounders и др.), но уж как-то статьи для массового (не в лучшем смысле) читателя и статьи для пиарного хода (распиарить новые слова о старых истинах) очень выбиваются обычно семантически и логически из аргументов для разумного научного спора (ну и разумного доказывания аргументов, т.е. причинно-следственных связей тех или иных зависимостей, доказанных(!) ПРАВИЛЬНЫМ планированием и постановкой ряда экспериментов)...

... для ритэйл (в виду неполной информированности о рынке) - causal inference непонятен в принципе, для НИИ - недоказуем (по той же причине ввиду разл. элементов коммерческой тайны), для стат.комитета гос. уровня, возможно, есть какие-либо репрезентативные выборки... но стат-ка по финансам в любом случае всегда упирается в коммерческую тайну... а для маркетологов - просто игрушка  "заглянуть в чужой кошелёк любой ценой" -- вот поэтому мне кажется, ваш линк больше интересен как "игрушка для маркетологов", но по сути, базирующаяся на классической стат. методологии, -- просто им классика науч. исследований, теор.вер. и мат.стат. не всегда и интересны и не всегда им доступна вся инфо для полноценного мат. моделирования, как впрочем и для психологов, и для социологов и т.д. ввиду "этичности экспериментов"  ...

>> вот и приводят "toy examples" в своих статьях и книгах, над которыми засыхает большое количество мозгов - просто потому что в реал. жизни ни таких экспериментов не произвести, ни таких данных не получить, никакого финансирования на такие исследования не найти, ни такой пустой логики про бассейны не найти,  а бизнес хочет объяснений, когда и как рождается спрос... вот и пишут статьи "шир.потреб" для горе маркетологов, мечтающих прокатиться на хребте у инфляции - долго и в профит... а мозги, засыхающие, пытаются припаять эти toy-examples к реал. жизни...

реальный, научно обоснованный, логически адекватный, научный эксперимент о тех или иных зависимостях подразумевает правильное планирование эксперимента для собирания доказательной базы для тех/иных логических выводов, статистически подтверждённых ... а не популизм статистики per se, но англоязычными терминами...

мне так показалось из косноязычного линка (( - поэтому не переживайте, что сразу не паяется та статья к анализу рынка...

--- это мой Review

Speed vs. Accuracy: When is Correlation Enough? When Do You Need Causation?
Speed vs. Accuracy: When is Correlation Enough? When Do You Need Causation?
  • adam kelleher
  • medium.com
Often, we need fast answers with limited resources. We have to make judgements in a world full of uncertainty. We can’t measure everything. We can’t run all the experiments we’d like. You may not have the resources to model a product or the impact of a decision. How do you find a balance between finding fast answers and finding correct answers...
 
Это какая-то вводная или рекламная статья, там вроде на саму библиотеку ссылка была.
И что-то про inference для временных рядов дальше было, пока нет времени разбираться. Может раздутая тема, не исключаю

Думаю, имеет смысл искать по запросам “time series classification causal inference” и все в таком духе 
 
Maxim Dmitrievsky #:
Это какая-то вводная или рекламная статья, там вроде на саму библиотеку ссылка была.
И что-то про inference для временных рядов дальше было,    

да уж, действительно рекламная... и не в лучших традициях искусства рекламы...

в части timeseries (линка) идёт отсылка на SUTVA, которая по книге

The assumption of no interference was labeled "no interaction between units" by Cox (1958),

and is included in the "stable-unit-treatment-value assumption (SUTVA)" described by Rubin (1980).

VanderWeele (2009) formalized this point as the assumption of "treatment variation irrelevance," i.e., the assumption that multiple versions of treatment may exist but they all result in the same outcome.

In the presence of interference, the counterfactual for an individual i is not well defined because an individual's outcome depends on other individuals' treatment values.

Like the assumption of no interference, the assumption of no multiple versions of treatment is included in the "stable-unit-treatment-value assumption (SUTVA)" described by Rubin (1980).

Interference exists when treating one individual a ect the outcome of others in the population.

и далее по книге - несколько строк про " transportability [включая рекламу] of causal inferences across populations", но при этом "each method's estimate is based on different modeling assumptions." - что обычно в моделировании. Далее надежды маркетологов на типа "распространение слухов" в популяции, при этом они разделяют особей популяции по внушаемости (те, кто верят, не верят, сопротивляются, жалуются, уступают) - т.е. новый division for classification... такими темпами от моделирования движения цены мы явно уйдём в моделирование общественных масс, пока будем мечтать, что рынок двигает всё тот-же sentiment, а его не надо моделировать - его надо просто собрать в кучу и направить по направлению (психология толпы) хоть на луну -- во что и играются маркетологи... мечтая себя приравнять к политологам... 

и технологий PR и распространения инфо в социуме множество - как манипуляции общественным мнением... все "тренируются" в распространении своих домыслов, мечтая влиять на чей-то decision-making process... но решения, принимаемые на основании взглядов толпы редко бывают долгосрочны и всегда есть "стоп-уровни", за которые толпе не дадут выйти (кто? - Регулятор, если он исполняет свои функции)... думаю, бесперспективно изучать поведение во флете (кто об кого и какими средствами, хоть interference, хоть SUTVA) -- если цель присоединиться к смартам и " follow their coat-tail"

книга, кстати, называется What IF - harvard.edu (до конца не дочитала - уже чтение по диагонали  вызывает улыбку)

p.s.

нет, ну всё-таки что только не придумают и обзовут это высоко-технологичными расчётами, чтобы в экономике не распространять блага среди людей, а дать игрушку в руки маркетологов, и распространять рекламу (суррогат реального продукта, фикция, надежда, мечта, самообман) - и радоваться, что у них такая "хорошая" и "перспективная" работа - маркетинг... мне всё равно ближе нормальная научно-обоснованная логика, даже если поведения толпы... но не принимаю торговые решения по поведению толпы и никому не советую...

поэтому анализ causal inference (кто кого пихнул в толпе и как разразилась драка) не считаю моделированием процесса ценообразования, но моделированием драки... всегда есть арбитр (и это не маркетинг - это экономика!, между ними нету знака равно), а учесть всё невозможно ( Моделирование - ЭТО всегда те или иные Assumptions, если моделируется объект, который до конца не изучить)

p.p.s.

споры о равенстве экономических и политических технологий не приемлю... "социально-экономичесое поле" - больше напоминает земные законы, чем лингвистические абстракции... здесь На_земле есть "благо" (будь то лопата, или что др.), "надо-не_надо", и "предельная полезность" от этого блага, которую надо максимизировать, но есть ограничения - бюджет и др. ресурсы -- это в бизнесе... а в жизни есть регулятор... он и вынуждает совокупный спрос и предложение расширяться или сжиматься в силу сложившихся обстоятельств... вывод: " follow their coat-tail", но не смешивать маркетинг в худших его традициях с экономикой и жизнью реальных людей (включая пенсионные фонды, хедж-фонды, инвест-фонды для обслуживания деньгами людей - рынок ликвидности)

Причина обращения: