Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2425
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Итак, провел я первую фазу исследований
Сколько же энергии ушло....
Сколько же энергии ушло....
Это подарок всем скептикам.
А вот проверю я Вашу идею - мне не сложно. Так какой коэффициент корреляции взять? И как из оставшихся предикторов отобрать 5-15 - напишите конкретно - может как измерить их там надо и упорядочить?
Сколько же энергии ушло....
Вместо того, что бы считать чужие деньги, могли бы Вы подсказать по R?
Вот сделал скрипт, который должен корреляцию посчитать и удалить коррелирующие столбцы.
И есть два вопроса:
1. Как сделать выполнение этого кода в цикле for, а именно мне нужно увеличивать коэффициент и менять название файла для сохранения с индексом коэффициента, или в другую директорию, генерируемую в цикле.
2. Я убираю для расчетов вспомогательные столбцы, как их скопировать в появившуюся таблицу (df2) после удаления коррелирующих столбцов.
Спасибо за ответ.
Вместо того, что бы считать чужие деньги, могли бы Вы подсказать по R?
Вот сделал скрипт, который должен корреляцию посчитать и удалить коррелирующие столбцы.
И есть два вопроса:
1. Как сделать выполнение этого кода в цикле for, а именно мне нужно увеличивать коэффициент и менять название файла для сохранения с индексом коэффициента, или в другую директорию, генерируемую в цикле.
2. Я убираю для расчетов вспомогательные столбцы, как их скопировать в появившуюся таблицу (df2) после удаления коррелирующих столбцов.
Спасибо за ответ.
ответ на вопрос (2)
теперь можно написать функцию которая делает тоже самое но выглядит более аккуратно
на вход подается файл
указываем колонки что не будут использоваться для корел анализану и настройка коеф. корел из функции findCorrelation
cor.coef = 0.1
на выходе получаем df1 но без мусорных признаковтеперь ответ на первый вопрос
Далее мной было проведено обучение с фиксированной настройкой квантовой таблицы на выборке train - 60% test - 20% exam - 20% с
А вам не кажется, что вы свою модель тюните под самый успешный вариант на test?
Сам несколько раз попадал на удачные тестовые участки и думал - вот он Грааль))). А после смещения участков вперед или назад на несколько месяцев, - все становилось ясно и модель уже не та и предикторы не те, а на тех - слив.
Я полностью перешел на анализ моделей на кросс-валидации или валкинг-форварде. В лучшем случае видел 50%50.
У дока в одном из последних сообщений было тоже про кросс-валидацию.
У Максима, программиста, с которым я здесь ругался, советник на машинном обучении на бэктестах - просто огонь, на форвард тестах продержался полтора месяца тоже с приличной прибыльной статистикой, сейчас сливает просто не делая даже пауз))
Приведите, пожалуйста, пример прибыльного советника на машинном обучении, который хотя бы 3 месяца работал на реальном рынке в прибыль без переобучения
Так а в чем собственно проблема непрерывно дообучать? Что за вакуумные условия "без переобучения"? Если на форварде работает хоть день это уже грааль, а дообучать можно хоть каждым тиком, это дело техники.
теперь ответ на первый вопрос
Спасибо!
Попробую разобраться, но сходу сложно - всё же синтаксис кода существенно отличается от C++.
А вам не кажется, что вы свою модель тюните под самый успешный вариант на test?
А в какой момент я тюню на test, на Ваш взгляд? Выборка "test" используется для остановки обучения, в Проектах, кроме одного, её вообще нет, потом я использовал её при окончательном обучении - ну можно заменить на фиксированное число деревьев - 50/100/300/500/800 и посмотреть результат по всем выборкам, тогда полагаете будет получен значительно хуже результат?