Попробуйте написать автоматический синтез стратегий с проверкой по критерию непереобучености - Общее обсуждение

mytarmailS 2023.06.02 20:35 #30881

Forester #:
Расскажите лучше в чем идея? Сравнивают стат. параметры на участках обучения и теста? И если хуже в 2,3,5,10 раз то переобучена?

Я ещё сам не разбирался, только на глаза попалось, не хватает времени на все катастрофически

Maxim Dmitrievsky 2023.06.03 00:47 #30882

mytarmailS #:
Я ещё сам не разбирался, только на глаза попалось, не хватает времени на все катастрофически

😀😀😀😀😀😁😁😁😁😂😂😂😂😂👍

Viktor Kudriavtsev 2023.06.03 03:57 #30883

Подскажите а если под Linux установить mt5 то OpenAL будет работать? Кто нибудь пробовал?

Forester 2023.06.03 06:59 #30884

mytarmailS #:
Я ещё сам не разбирался, только на глаза попалось, не хватает времени на все катастрофически

Тут описание метода на 30 страниц https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2326253 . Начал читать. Судя по всему на кросс-валидации основано, но со своими особенностями - комбинаторно-симметричной

The Probability of Backtest Overfitting

papers.ssrn.com

Most firms and portfolio managers rely on backtests (or historical simulations of performance) to select investment strategies and allocate them capital. Standa

СанСаныч Фоменко 2023.06.03 07:34 #30885

Andrey Dik #:

да как раз на R никто и не нападал. перелистай страницы назад, освежи память.

Саныч назвал колхозниками меня и всех, кто не стучит лбом об алтарь R.

Уж, извините за колхоз, может не совсем точно.

Еще раз попытаюсь объяснить отличие профессиональной разработки от деревенской по принципу "первый парень на деревне".

R - это не просто язык программирования, а СРЕДА для разработки узко специализированных задач - статистики, к которой относят МО и еще что-то.

Пакеты в R - это часть языка. Посмотрим поставку дистрибутива языка - там уже несколько базовых пакетов.

Набор пакетов в R, а это свыше 10 000 пакетов с более 100 000 функций, представляют собой ФУНКЦИОНАЛЬНО ПОЛНЫЙ набор для решения задач, например, МО.

Поясню на примере МО.

На сайте большей частью обсуждаются разные варианты алгоритмов классификации, особенно варианты НС. Особенно показательна подборка метаквотов для питона.

С точки зрения МО сам алгоритм классификации - это часть проблемы, процентов 30%. Попробуйте в деревне под названием Питон найти остальные 70%. А найти другие варианты моделей классификации, а их до 200 (1) практически невозможно.

В R имеется прекрасный справочный аппарат который позволит найти недостающее.

Если не знаете ЧТО искать, то на первом этапе можно взять Rattle, чтобы увидеть что такое комплекс инструментов для МО: первичный анализ данных, преобразование, отбор предикторов, подготовка файлов для тестирования, расчет по модели или моделям, оценка результатов с соответствующим графическим представлением. Это базовый уровень.

Если переросли Rattle, то можно взять оболочку Caret, которая на самом высоком уровне покрывает проблематику МО. В Caret предоставляет доступ до 200 (!) пакетов, которые будут давать сигналы для трейдинга. Эти пакеты можно сравнивать, выбирать, составлять ансамбли моделей. Сaret имеет все, что было Rattle, но на более профессиональном уровне.

Для всего, что имеется в Caret, в R имеются аналоги и огромное количество других вспомогательных инструментов. Все это представляет ЕДИНОЕ ЦЕЛОЕ.

Все это называется ПРОФЕССИОНАЛЬНОЙ СРЕДОЙ для работы в области статистики и МО в частности.

Bayesian regression - Делал Машинное обучение в трейдинге Почему Python так моден

Maxim Dmitrievsky 2023.06.03 07:39 #30886

😂😂😂😂

Forester 2023.06.03 07:41 #30887

Ответ от Прадо и других Максиму с его предпочтением брать ООС на раннем участке:
Страница 7.

В-четвертых, даже если исследователь работает с большой выборкой, анализ
OOS должен будет охватить большую часть выборки, чтобы быть окончательным,
что наносит ущерб разработке стратегии (см. Хокинс [15]). Если ООС
берется с конца временного ряда, мы теряем самые последние
наблюдения, которые часто являются наиболее репрезентативными в будущем. Если OOS
берется с начала временного ряда, тестирование проводилось на
возможно, это наименее репрезентативная часть данных.

Полезные функции от KimIV Где грань между подгонкой Ищу реальные, реально слитые

mytarmailS 2023.06.03 07:48 #30888

Forester #:
Тут описание метода на 30 страниц https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2326253 . Начал читать. Судя по всему на кросс-валидации основано, но со своими особенностями - комбинаторно-симметричной

Мне даже читать впадлу уже, выгорел что ли..

Но могу написать автоматический синтез стратегий с проверкой по критерию непереобучености..

Другими словами я могу создавать стратегии которые будут максимизировать критерий непереобучености..

Насинтезирую стратегий по этому критерию , потом можно проверить на новых данных , лажа это или стоит внимания..

Протестировал -> получил результат -> выкинул/освоил

А носиться годами с одной идеей как "казуал клоун" и так ничего не сделать и кидаться на всех это тупик

Что там есть критерий непереобучености?

Как написать код для [Архив!] Любой вопрос новичка, Вывод советником сообщений в

Forester 2023.06.03 07:48 #30889

Forester #:
Ответ от Прадо и других Максиму с его предпочтением брать ООС на раннем участке:
Страница 7.

В-четвертых, даже если исследователь работает с большой выборкой, анализ
OOS должен будет охватить большую часть выборки, чтобы быть окончательным,
что наносит ущерб разработке стратегии (см. Хокинс [15]). Если ООС
берется с конца временного ряда, мы теряем самые последние
наблюдения, которые часто являются наиболее репрезентативными в будущем. Если OOS
берется с начала временного ряда, тестирование проводилось на
возможно, это наименее репрезентативная часть данных.

Думаю поэтому они и используют кросс-валидацию, чтобы все участки данных были по очереди в OOS

Forester 2023.06.03 07:51 #30890

mytarmailS #:

Что там есть критерий непереобучености?

На 8-й странице пока. И это еще вступление))
Похое что это будет сравнение по Шарпу (но пишут, что можно любой др. показатель) на кросс валидации.

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3089