Зачем заниматься чепухой и валить все подряд на вход модели? - Общее обсуждение

СанСаныч Фоменко 2017.08.13 08:30 #4521

Тема скатилась к гаданию на кофейной гуще - хотя бы науку привлекли, называется астрология.

Зачем заниматься чепухой и валить все подряд на вход модели? Вроде бы почти сотню страниц обсуждали, что надо брать только те предикторы, которые влияют на целевую переменную. Я всегда выполняю датамайнинг и у меня не бывает моделей с ошибкой более 40%. Правда с моделями с ошибкой менее 30% напряг. Но такого безобразия как 50% вообще никогда.

Эконометрика: прогноз по модели Забудьте про случайные котировки EURUSD - Тенденции, прогнозы

toxic 2017.08.13 09:31 #4522

СанСаныч Фоменко:

Тема скатилась к гаданию на кофейной гуще - хотя бы науку привлекли, называется астрология.

Зачем заниматься чепухой и валить все подряд на вход модели? Вроде бы почти сотню страниц обсуждали, что надо брать только те предикторы, которые влияют на целевую переменную. Я всегда выполняю датамайнинг и у меня не бывает моделей с ошибкой более 40%. Правда с моделями с ошибкой менее 30% напряг. Но такого безобразия как 50% вообще никогда.

Потому что у Вас "смешались кони люди, фичи, таргеты, ZZ...", а предсказывали бы цвет свечи или ретурн, на таких частотах(>5мин), имели бы примерно тоже самое.

toxic 2017.08.13 09:37 #4523

Dr. Trader:

Эксперимент. А что если взять разных gbpusd, usdchf, usdrub, и прочих популярных символов, и с их помощью предсказывать eurusd.

Вот 2 таблички в атаче, train.csv и test.csv, в них таргет - прирост eurusd m5 за следующий бар, а предикторы - audusdOpen[0]-audusdOpen[1], audusdOpen[2]-audusdOpen[3], audusdOpen[3]-audusdOpen[4], eurusdOpen[0]-eurusdOpen[1], eurusdOpen[1]-eurusdOpen[2], итд. Всего 12 символов, из каждого взяты приросты за предыдущих 3 бара истории. В общем по названию колонок всё понятно.
В обучающей табличке 10000 строк, это около 7 недель.

Я попробовал обучить одну модель, получил на обучающих данных r^2 = 0.0006164161, и если округлить таргет и результаты к классам -1 и 1 то точность 0.5052. Это очень плохо. Но просто нереально брать по десятки бар на каждый обучающий пример и десятки самих символов, у меня модель на этих сотнях колонок будет обучаться неделями.
На тестовой табличке результаты проверки модели упали, r^2 = -0.003390913 и точность 0.4907. Рандом был, рандом и остался.

Но это всё скучно и безрезультатно.
Интересно получилось когда я посмотрел какие веса модель дала каждому предиктору (чем выше вес тем лучше):

Вывод: пытаться предсказать направление куда пойдёт eurusd на следующем m5 баре лучше используя в первую очередь audusd, usdrub, usdsgd

Да, результат хреновый, зато честный, на тестере будет релевантное эквити, а не как у некоторых ошибка на форварде 30% а Шарп ратио +-0.5, когда как должно быть все 10)))

Фичи у Вас совсем плохие, хотя бы для каждого инструмента по несколько прошлых ретурнов с экспоненциально возрастающим окном(1,2,5,10,30,60...) ну и лучше минутки брать

Ожидание выполнения функции OrderClose() Обсуждение статьи "Секвента ДеМарка Средняя стоимость советника

Mihail Marchukajtes 2017.08.13 10:10 #4524

Если честно я тоже так стал думать уже давно про Юру Решетова. Он как то заикнулся, "Я сокору уйду от сюда" Я ещё так удивился, сначала подумал может устроился кудато в секретную организацию, мало ли... потом сайт перестал работать ну и т.д. Очень жаль если это так, пусть земля уме будет пухом.....

На самом деле серьёзность его работы бесспорно..... Но мне кажется он её не доделал самую малость..... Думаю разобрать его метод подробней да что нибуди прикрутить к нему... вобщем посмотрим.....

100 пунктов Как правильно оформить новую Грааль. Интересная тема -

СанСаныч Фоменко 2017.08.13 10:45 #4525

toxic:

Потому что у Вас "смешались кони люди, фичи, таргеты, ZZ...", а предсказывали бы цвет свечи или ретурн, на таких частотах(>5мин), имели бы примерно тоже самое.

Вот у меня как раз ничего не смешалось: основная проблема в датамайнинг, основной объем трудозатрат.... А у вас тут интеллектуальная развлекуха.

toxic 2017.08.13 10:56 #4526

СанСаныч Фоменко:

Вот у меня как раз ничего не смешалось: основная проблема в датамайнинг, основной объем трудозатрат.... А у вас тут интеллектуальная развлекуха.

У меня как раз с предиктами ХФТ всё чинно благородно, я выкладывал датасет, а 10 мин и выше там вообще нифига нет, в самих ценах, это нужны уже другие данные, макро, новости и тп. в самой цене ноль, пресловутая эффективность.

Почему не работает индикатор Нужен советник FAQ по сервису Сигналы

Yuriy Asaulenko 2017.08.13 11:10 #4527

toxic:

У меня как раз с предиктами ХФТ всё чинно благородно, я выкладывал датасет, а 10 мин и выше там вообще нифига нет, в самих ценах, это нужны уже другие данные, макро, новости и тп. в самой цене ноль, пресловутая эффективность.

Скорее склонен с Вами согласится. Но вот как быть с людьми, которые открываются по приметам, типа ТА, и уверяют, что регулярно и с удовольствием выигрывают?

Тут 2 варианта: 1. они выдают желаемое за действительное и все это только языком ля-ля, и 2. старше 10 мин все-таки что-то есть, имеющее предсказательную ценность.

Прогноз будущего при помощи [Архив!] Чистая математика, физика, Любое прогнозирование обречено?

Алёша 2017.08.13 15:13 #4528

toxic:

У меня как раз с предиктами ХФТ всё чинно благородно, я выкладывал датасет, а 10 мин и выше там вообще нифига нет, в самих ценах, это нужны уже другие данные, макро, новости и тп. в самой цене ноль, пресловутая эффективность.

И получается HFT проторговать? Если не секрет естесно и "по чесноку"...

Mihail Marchukajtes 2017.08.13 15:15 #4529

Vizard_:

Не спугни, я над ними с Вовой уже давно ржу, хотя Мишка всех переплюнул)))
Входа не светите и не обсуждайте, пусть сами)))

Ну так... ещёбы..... Вас не растормошишь, хрен кто что предложит толкового.... Ты я смотрю только ржёшь выглядывая из за угла.... Какой в тебе толк???

Наверно такой же как и от меня. Никакого.... Но я хотя бы забавный :-)

Авто или мануал tractor F Должно ли ТЗ сопровождаться

Mihail Marchukajtes 2017.08.13 16:44 #4530

Vizard_:

Прости, Учитель))))))

Ну ладно... я на тебя не сержусь..... Мне просто интересно, ну чисто теоретически..... Эксперимента ради. Я скину ещё раз свой датасет, он будет затрагивать аж 3 фьючерса, то есть почти 9 месяцев данных, ты посроишь по нему модель и выдашь какой нибудь вердикт. В идеале хотелось бы запустить твою модель у себя на компе, но я особо не настаиваю..... Просто интересно....

Ну так что??? Выкладывать?

Обсуждение статьи "Секвента ДеМарка FOREX - Тенденции, прогнозы АКЦИИ новости , прогнозы

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 453