Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 453

 

Тема скатилась к гаданию на кофейной гуще - хотя бы науку привлекли, называется астрология.


Зачем заниматься чепухой и валить все подряд на вход модели? Вроде бы почти сотню страниц обсуждали, что надо брать только те предикторы, которые влияют на целевую переменную. Я всегда выполняю датамайнинг и у меня не бывает моделей с ошибкой более 40%. Правда с моделями с ошибкой менее 30% напряг. Но такого безобразия как 50% вообще никогда. 

 
СанСаныч Фоменко:

Тема скатилась к гаданию на кофейной гуще - хотя бы науку привлекли, называется астрология.


Зачем заниматься чепухой и валить все подряд на вход модели? Вроде бы почти сотню страниц обсуждали, что надо брать только те предикторы, которые влияют на целевую переменную. Я всегда выполняю датамайнинг и у меня не бывает моделей с ошибкой более 40%. Правда с моделями с ошибкой менее 30% напряг. Но такого безобразия как 50% вообще никогда. 

Потому что у Вас "смешались кони люди, фичи, таргеты, ZZ...", а предсказывали бы цвет свечи или ретурн, на таких частотах(>5мин), имели бы примерно тоже самое.

 
Dr. Trader:

Эксперимент. А что если взять разных gbpusd, usdchf, usdrub, и прочих популярных символов, и с их помощью предсказывать eurusd.

Вот 2 таблички в атаче, train.csv и test.csv, в них таргет - прирост eurusd m5 за следующий бар, а предикторы - audusdOpen[0]-audusdOpen[1], audusdOpen[2]-audusdOpen[3], audusdOpen[3]-audusdOpen[4], eurusdOpen[0]-eurusdOpen[1], eurusdOpen[1]-eurusdOpen[2], итд. Всего 12 символов, из каждого взяты приросты за предыдущих 3 бара истории. В общем по названию колонок всё понятно.
В обучающей табличке 10000 строк, это около 7 недель.

Я попробовал обучить одну модель, получил на обучающих данных r^2 = 0.0006164161, и если округлить таргет и результаты к классам -1 и 1 то точность 0.5052. Это очень плохо. Но просто нереально брать по десятки бар на каждый обучающий пример и десятки самих символов, у меня модель на этих сотнях колонок будет обучаться неделями.
На тестовой табличке результаты проверки модели упали, r^2 = -0.003390913 и точность 0.4907. Рандом был, рандом и остался.

Но это всё скучно и безрезультатно.
Интересно получилось когда я посмотрел какие веса модель дала каждому предиктору (чем выше вес тем лучше):


Вывод: пытаться предсказать направление куда пойдёт eurusd на следующем m5 баре лучше используя в первую очередь audusd, usdrub, usdsgd

Да, результат хреновый, зато честный, на тестере будет релевантное эквити, а не как у некоторых ошибка на форварде 30% а Шарп ратио +-0.5, когда как должно быть все 10)))

Фичи у Вас совсем плохие,  хотя бы для каждого инструмента по несколько прошлых ретурнов с экспоненциально возрастающим окном(1,2,5,10,30,60...) ну и лучше минутки брать

 

Если честно я тоже так стал думать уже давно про Юру Решетова. Он как то заикнулся, "Я сокору уйду от сюда" Я ещё так удивился, сначала подумал может устроился кудато в секретную организацию, мало ли... потом сайт перестал работать ну и т.д. Очень жаль если это так, пусть земля уме будет пухом.....

На самом деле серьёзность его работы бесспорно..... Но мне кажется он её не доделал самую малость..... Думаю разобрать его метод подробней да что нибуди прикрутить к нему... вобщем посмотрим.....

 
toxic:

Потому что у Вас "смешались кони люди, фичи, таргеты, ZZ...", а предсказывали бы цвет свечи или ретурн, на таких частотах(>5мин), имели бы примерно тоже самое.


Вот у меня как раз ничего не смешалось: основная проблема в датамайнинг, основной объем трудозатрат.... А у вас тут интеллектуальная развлекуха.

 
СанСаныч Фоменко:

Вот у меня как раз ничего не смешалось: основная проблема в датамайнинг, основной объем трудозатрат.... А у вас тут интеллектуальная развлекуха.

У меня как раз с предиктами ХФТ всё чинно благородно, я выкладывал датасет, а 10 мин и выше там вообще нифига нет, в самих ценах, это нужны уже другие данные, макро, новости и тп. в самой цене ноль, пресловутая эффективность.

 
toxic:

У меня как раз с предиктами ХФТ всё чинно благородно, я выкладывал датасет, а 10 мин и выше там вообще нифига нет, в самих ценах, это нужны уже другие данные, макро, новости и тп. в самой цене ноль, пресловутая эффективность.

Скорее склонен с Вами согласится. Но вот как быть с людьми, которые открываются по приметам, типа ТА, и уверяют, что регулярно и с удовольствием выигрывают?

Тут 2 варианта: 1. они выдают желаемое за действительное и все это только языком ля-ля, и 2. старше 10 мин все-таки что-то есть, имеющее предсказательную ценность.

 
toxic:

У меня как раз с предиктами ХФТ всё чинно благородно, я выкладывал датасет, а 10 мин и выше там вообще нифига нет, в самих ценах, это нужны уже другие данные, макро, новости и тп. в самой цене ноль, пресловутая эффективность.

И получается HFT проторговать? Если не секрет естесно и "по чесноку"...

 
Vizard_:

Не спугни, я над ними с Вовой уже давно ржу, хотя Мишка всех переплюнул)))
Входа не светите и не обсуждайте, пусть сами)))


Ну так... ещёбы..... Вас не растормошишь, хрен кто что предложит толкового.... Ты я смотрю только ржёшь выглядывая из за угла.... Какой в тебе толк???

Наверно такой же как и от меня. Никакого.... Но я хотя бы забавный :-)

 
Vizard_:

Прости, Учитель))))))


Ну ладно... я на тебя не сержусь..... Мне просто интересно, ну чисто теоретически..... Эксперимента ради. Я скину ещё раз свой датасет, он будет затрагивать аж 3 фьючерса, то есть почти 9 месяцев данных, ты посроишь по нему модель и выдашь какой нибудь вердикт. В идеале хотелось бы запустить твою модель у себя на компе, но я особо не настаиваю..... Просто интересно.... 

Ну так что??? Выкладывать?