Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3196

 
Maxim Dmitrievsky #:

Да зачем другие, на одном можно

можно меньше, без разницы, но чтобы не сильно мало (сила малости определяется интуитивно-эмпирически)

чем больше симуляций, тем более усредненный результат. Биас - варианс трэйдофф.

То есть, при достижении какого-то порога кол-ва симуляций, кватрезки перестанут быть полезными в плане извлечения прибыли, будут слишком усреднены. Это в том случае, если рынок действительно рэндом. Если дойдете до этой стадии, то фактически посчитаете, что рынок - рэндом. Ну или ваши связки фича-признаков неэффективны.

будет нормальный монте-карло здорового человека )

Как я понимаю, предлагаете следующие по сути:

  1.  На оригинальной выборке найти квантовые отрезки и создать сетку квантования по ним для всей выборки.
  2.  Создать символ, похожий по характеристикам с оригинальным - n раз.
  3.  Сделать выборку по числу сгенерированных символов.
  4.  По таблице из пункта 1 провести поиск квантовых отрезков - на n выборках.
  5.  Посчитать, сколько удалось обнаружить квантовых отрезков на сгенерированных выборках относительно оригинальной.

Может я и мог бы сделать пару десятков выборок, но:

1. У меня нет понимания, как сгенерировать действительно похожий на оригинал символ - нет инструмента.

2. Как предлагаете интерпретировать результат, если будет много "попадания" и, если мало, в диапазоны квантовых отрезков?

 
Forester #:
Тот пакет на dll работает. А они только в винде работают.
Посморел новости - вижу только годовой давности об ограничениях на скачивание дистрибутива W10 и W11. И о их снятии в конце 2022. Где-то есть свежие?

Говорили, что активацию отключат по ключу для корпоративных клиентов.

 
Aleksey Vyazmikin #:

Как я понимаю, предлагаете следующие по сути:

  1.  На оригинальной выборке найти квантовые отрезки и создать сетку квантования по ним для всей выборки.
  2.  Создать символ, похожий по характеристикам с оригинальным - n раз.
  3.  Сделать выборку по числу сгенерированных символов.
  4.  По таблице из пункта 1 провести поиск квантовых отрезков - на n выборках.
  5.  Посчитать, сколько удалось обнаружить квантовых отрезков на сгенерированных выборках относительно оригинальной.

Может я и мог бы сделать пару десятков выборок, но:

1. У меня нет понимания, как сгенерировать действительно похожую на оригинал выборку - нет инструмента.

2. Как предлагаете интерпретировать результат, если будет много "попадания" и, если мало, в диапазоны квантовых отрезков?

Рандомно символ тасуете n раз, смотрите среднее по кватрезкам (какие лучшие). Если в среднем никакие не лучшие, значит терять там нечего.

 
Maxim Dmitrievsky #:

Рандомно символ тасуете n раз, смотрите среднее по кватрезкам (какие лучшие).

Как я понимаю, нужно взять приращения (OHLC) и перемешать случайным образом значения? Или взять, допустим, и разбить приращения на 100 окон и мешать окна? Где то слышал, что временные ряды только окнами допустимо мешать....

С кастомными символами не разбирался - нет у Вас скрипта для этой цели?

Maxim Dmitrievsky #:

Если в среднем никакие не лучшие, значит терять там нечего.

Очень сумбурно - я не понимаю, что значит в "среднем" и не лучше чего? Лучше оригинала быть не может - он ограничивает зону поиска, значит, если среднее значение близко к оригиналу, то "терять там нечего", иными словами, это значило бы, что случайным образом могли быть отобранны квантовые отрезки, т.е. критерий для их отбора недостаточно хорош?

 
Aleksey Vyazmikin #:

Как я понимаю, нужно взять приращения (OHLC) и перемешать случайным образом значения? Или взять, допустим, и разбить приращения на 100 окон и мешать окна? Где то слышал, что временные ряды только окнами допустимо мешать....

С кастомными символами не разбирался - нет у Вас скрипта для этой цели?

Очень сумбурно - я не понимаю, что значит в "среднем" и не лучше чего? Лучше оригинала быть не может - он ограничивает зону поиска, значит, если среднее значение близко к оригиналу, то "терять там нечего", иными словами, это значило бы, что случайным образом могли быть отобранны квантовые отрезки, т.е. критерий для их отбора недостаточно хорош?

У вас больше нет оригинала. А перетасованный символ. Приращения, да.

на каждом таком символе определяете лучший кватрезок, потом смотрите какой лучший в среднем по всем симуляциям.

если я правильно понимаю что вообще такое кватрезок. Если диапазон значений фичей, то все сходится.

я не делаю ничего в терминале, только ботов компилиюрую в него
 
Maxim Dmitrievsky #:

У вас больше нет оригинала. А перетасованный символ. Приращения, да.

на каждом таком символе определяете лучший кватрезок, смотрите какой лучший в среднем по всем симуляциям.

я не делаю ничего в терминале, только ботов компилиюрую в него

Не понятно - какой то явно будет лучше других чисто случайно чаще выпадет (даже если всего два раза) - в чём тут смысл?

Для упрощения можно одну квантовую таблицу взять.

В итоге получим, что на предикторе 1 больше выпола на 5 квантовый отрезок, для предиктора 2 на 3, и так далее.

При этом надо понимать, что отрезки для каждого предиктора разные.

И, как Вы хотите свести всё это в одно усреднение для какого либо вывода?

 
Aleksey Vyazmikin #:

Не понятно - какой то явно будет лучше других чисто случайно чаще выпадет (даже если всего два раза) - в чём тут смысл?

Для упрощения можно одну квантовую таблицу взять.

В итоге получим, что на предикторе 1 квантовый больше выпола на 5 квантовый отрезок, для предиктора 2 на 3, и так далее.

При этом надо понимать, что отрезки для каждого предиктора разные.

И, как Вы хотите свести всё это в одно усреднение для какого либо вывода?

для каждой фичи свое среднее. Сколько их всего этих отрезков? Симуляций должно быть больше кратно.

это все решаемо и уже технические вопросы, не принципиальные.

Чисто случайно 10к раз он выпадет, если график реально рандомный. Если нет, то будет найден тот отрезок, который содержит закономерности.

 
Maxim Dmitrievsky #:

для каждой фичи свое среднее. Сколько их всего этих отрезков? Симуляций должно быть больше кратно.

это все решаемо и уже технические вопросы, не принципиальные.

Число отрезков для каждого предиктора будет разным - возьму сводную по результатам отбора на оригинальной выборке - ведь по сути это не важно для рандома. Вообще у меня под 900 таблиц, но делать ещё потабличный учёт тут будет избыточно.

 
Aleksey Vyazmikin #:

Число отрезков для каждого предиктора будет разным - возьму сводную по результатам отбора на оригинальной выборке - ведь по сути это не важно для рандома. Вообще у меня под 900 таблиц, но делать ещё потабличный учёт тут будет избыточно.

я просто написал, как можно оценить ваши отрезки монте-карлой

не знаю других способов
 
Maxim Dmitrievsky #:

я просто написал, как можно оценить ваши отрезки монте-карлой

Ну, если сруливаете уже, то опять тратить время и получать ответ по результатам в стили Алексея - мало мотивирует.

Причина обращения: