Bayesian regression - Делал ли кто советник по этому алгоритму?

 

 The strategy is able to nearly double the investment in less than 60 day period when run against real data trace.

I. Bayesian Regression The problem. We consider the question of regression: we are given n training labeled data points (xi,yi) for 1 ≤ i ≤ n with xi ∈ Rd,yi ∈ R for some fixed d ≥ 1. The goal is to use this training data to predict the unknown label y ∈R for given x ∈Rd. The classical approach. A standard approach from non-parametric statistics (cf. see [3] for example) is to assume model of the following type: the labeled data is generated in accordance with relation y = f(x)+ where is an independent random variable representing noise, usually assumed to be Gaussian with mean 0 and (normalized) variance 1. The regression methodboilsdowntoestimating f from n observation (x1,y1),...,(xn,yn)andusingitforfutureprediction. For example, if f(x) = xTθ∗, i.e. f is assumed to be linear function, then the classical least-squares estimate is used for estimating θ∗ or f: ˆ θLS ∈argmin θ∈Rd n X i=1 (yi −xT i θ)2 (1) [...] Bayesian regression and Bitcoin.pdf
 

Во-первых использовалась нормальная биржа, во-вторых наверное главные данные которые подавались -- это стакан, плюс там можно раздельно объемы получить, в третьих это криптовалюта.

ПДФка бородатая, думаю сейчас так просто уже не получится, торговать стало намного сложнее.

Но думаю пощипать все еще возможно.

Если вы с форексом хотите такую штуку провернуть, запейте холодной водой, я вам сразу скажу -- ничего не получится с 99% вероятностью.

 
Комбинатор:

Во-первых использовалась нормальная биржа, во-вторых наверное главные данные которые подавались -- это стакан, плюс там можно раздельно объемы получить, в третьих это криптовалюта.

ПДФка бородатая, думаю сейчас так просто уже не получится, торговать стало намного сложнее.

Но думаю пощипать все еще возможно.

Если вы с форексом хотите такую штуку провернуть, запейте холодной водой, я вам сразу скажу -- ничего не получится с 99% вероятностью.

Спасибо.

Интересует мнение о возможности использования этой стратегии на форексе. Мнения могут быть разные, особенно ценные те которые обоснованны практическим опытом.

 
lilita bogachkova:

Мнения могут быть разные, особенно ценные те которые обоснованны практическим опытом.
На самом деле все просто -- сможете найти данные на которых регрессия будет находить закономерности -- получится. Вот только тики на форекс это аггрегированные сглаженные изменения цены без какой-либо дополнительной инфы. стакан -- фикция, объемы -- фикция, сами котировки наполовину фикция. Как думаете -- получится на таких данных?
 
lilita bogachkova:

Спасибо.

Интересует мнение о возможности использования этой стратегии на форексе. Мнения могут быть разные, особенно ценные те которые обоснованны практическим опытом.

 

Байесовская регрессия похожа на гребневую регрессию, однако основана на том допущении, что в данных шум (ошибка) распределен нормально – соответственно, предполагается, что общее понимание о структуре данных уже имеется, и это дает возможность получать более точную модель (по сравнению с линейной регрессией уж точно). 

 Отсюда: http://datareview.info/article/10-tipov-regressii-kakoy-vyibrat/

 

В связи с предположением о нормальности ошибок я ставлю под сомнение применимость данного метода для фин.рынков.

 

К тому же, в любой модели, где зависимость оценивается только как гиперплоскость, есть шанс упустить нелинейный эдж, который и может сделать модель прибыльной. 

10 типов регрессии – какой выбрать?
10 типов регрессии – какой выбрать?
  • голосов: 4
  • datareview.info
Сегодня мы расскажем о десяти основных видах регрессии и подскажем, какой из них выбрать исходя из контекста поставленной задачи.
 
Alexey Burnakov:

В связи с предположением о нормальности ошибок я ставлю под сомнение применимость данного метода для фин.рынков.

Почему? Считаете, что закон нормального распределения не работает на фин. рынках? Если считать шум( ошибки) величинами случайными, то вполне уместно использовать для них распределение Гаусса.
 
Тут на самом деле мало что зависит от регрессии, больше от данных на входе.
 
Комбинатор:
Тут на самом деле мало что зависит от регрессии, больше от данных на входе.

Я бы даже усилил Вашу мысль: успех моделирования определяется не моделями (при правильном их применением), а входными данными. По моему опыту, некоторые наборы исходных данных ВСЕГДА приводят к переобученным моделям, а если с ними поработать, то вполне может оказаться, что можно получить не переобученные модели. Я считаю, что главное зло моделирования - переобученность - определяется исходными данными. Решение этой проблемы с помощью регуляризации - это полумера.

К наиболее перспективным я отношу: ada, randomforest, SVM.

Байесовской моделью из-за предположения о нормальности ошибки (как и много других моделей) лучше не пользоваться.

 
СанСаныч Фоменко:

Я бы даже усилил Вашу мысль: успех моделирования определяется не моделями (при правильном их применением), а входными данными. По моему опыту, некоторые наборы исходных данных ВСЕГДА приводят к переобученным моделям, а если с ними поработать, то вполне может оказаться, что можно получить не переобученные модели. Я считаю, что главное зло моделирования - переобученность - определяется исходными данными. Решение этой проблемы с помощью регуляризации - это полумера.

К наиболее перспективным я отношу: ada, randomforest, SVM.

Байесовской моделью из-за предположения о нормальности ошибки (как и много других моделей) лучше не пользоваться.

Спасибо.

Также интересует мнение по конкретно в статье описанному подходу к торговле.

 
С неправильной стороны подход к делу. Надо взять, закодить и проверить. А то уже начинаются... рассуждения о нормальностях распределения.
 
Yuri Evseenkov:
Почему? Считаете, что закон нормального распределения не работает на фин. рынках? Если считать шум( ошибки) величинами случайными, то вполне уместно использовать для них распределение Гаусса.

Ситуация, когда ошибки действительно будут нормальными, это редкость, и для этого нужно аккуратно воспроизвести плотность вероятности для исходного ряда в модели. Будет ли это достижимо? Вот в чем вопрос. А если от этого зависит правдоподобность оценки параметров модели, то можно промахнуться. Я бы пользовался непараметрическими методами, тот-же random forest, GBM, нелинейная SVM.

Но вообще говоря, люди, которые хорошо понимают линейную регрессию, и умеют выполнять feature engineering, на финансовых рынках получали результаты лучше случайного гадания.