Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2845

 

из справки непонятно, как рассчитывается комплексный критерий:

Также доступен "Максимум комплексного критерия". Это интегральный, комплексный показатель качества прохода тестирования. Он учитывает сразу несколько параметров:

  • Количество сделок
  • Просадка
  • Фактор восстановления
  • Мат. ожидание выигрыша
  • Коэффициент Шарпа

Этот критерий позволяет понять, что максимальное значение одного параметра (например, прибыли) не всегда является лучшим вариантом с точки зрения комплексного анализа. Он позволяет поэтапно выбирать наилучшие проходы: сначала по количеству сделок, затем из этой выборки по мат. ожиданию прибыльности, затем по фактору восстановления и так далее. Таким образом, в результате оптимизации вы получаете наилучшие проходы по всем параметрам, а далее из них вы уже можете выбрать конкретные, например, с наибольшей прибылью.

хоть это и интегральный критерий, но на мой взгляд весьма удачный. во многих случаях годный. вот бы ещё получить от разработчиков пояснения по этому критерию (как именно считается) и желательно отобразить пояснения в справке.

 
Andrey Dik #:

из справки непонятно, как рассчитывается комплексный критерий

понятно что там какая-то формула, возможно даже секретная, но если бы можно было задавать веса компонентам комплексного критерия... ммм, сказка.
 
Andrey Dik #:
понятно что там какая-то формула, возможно даже секретная, но если бы можно было задавать веса компонентам комплексного критерия... ммм, сказка.

Судя по описанию можно понять и так, что сначала отбирается часть лучших проходов по одному критерию, потом из отобранных отбирается часть лучших по второму критерию и так далее.

"Он позволяет поэтапно выбирать наилучшие проходы: сначала по количеству сделок, затем из этой выборки по мат. ожиданию прибыльности, затем по фактору восстановления и так далее."

 
Aleksey Nikolayev #:

Судя по описанию можно понять и так, что сначала отбирается часть лучших проходов по одному критерию, потом из отобранных отбирается часть лучших по второму критерию и так далее.

"Он позволяет поэтапно выбирать наилучшие проходы: сначала по количеству сделок, затем из этой выборки по мат. ожиданию прибыльности, затем по фактору восстановления и так далее."

критерий подсчитывается сразу, на каждом проходе оптимизации, а не в конце оптимизации с учетом всех результатов по отдельности каждого прохода. поэтому неувязочка там с фактом и описанием в справке.
 
Maxim Dmitrievsky #:

не увидел с ходу разницы и преимуществ

Новый способ для генерации табличных данных. Насколько он лучше? Или до сих пор GMM вне конкуренции?

https://github.com/kathrinse/be_great

 
Evgeni Gavrilovi #:

Новый способ для генерации табличных данных. Насколько он лучше? Или до сих пор GMM вне конкуренции?

https://github.com/kathrinse/be_great

Не знаю, не анализирую табличные данные 
Для временных рядов не подходит 
Какая-нибудь T-gan, возможно, будет лучше 

⚙️ Time-series Transformer Generative Adversarial Networks


Github: https://github.com/jsyoon0823/TimeGAN


Paper: https://arxiv.org/abs/2205.11164v1


Stock data: https://finance.yahoo.com/quote/GOOG/history


Energy data: http://archive.ics.uci.edu/ml/datasets/Appliances+energy+prediction



@ai_machinelearning_big_data


 
Maxim Dmitrievsky #:
Какая-нибудь T-gan, возможно, будет лучше

А как можно проверить правдоподобие? Сравнить распределения реальных и синтетических данных по отдельности для каждого ряда?

 
Evgeni Gavrilovi #:

А как можно проверить правдоподобие? Сравнить распределения реальных и синтетических данных по отдельности для каждого ряда?

Где-то видел через PCA сравнение наглядное, не вспомню с ходу. Может позже.
 
Evgeni Gavrilovi #:

А как можно проверить правдоподобие? Сравнить распределения реальных и синтетических данных по отдельности для каждого ряда?

https://hackernoon.com/a-gan-approach-to-synthetic-time-series-data-pe2r33fd

A GAN approach To Synthetic Time-Series Data | HackerNoon
A GAN approach To Synthetic Time-Series Data | HackerNoon
  • hackernoon.com
Although sequential data is pretty common to be found and highly useful, there are many reasons that lead to not leverage it
 

Какие предикторы можно придумать для гистограмм?

Приложил как файлы, так как картинки не хотят вставляться - видимо очередной баг.

Файлы: