Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3176

 
Aleksey Nikolayev #:

Можно же в МТ5 сделать, в стат. библиотеке есть функции генерации выборок для разных распределений. Например, в качестве признака в первый столбик генерируете нормальную выборку длиной 200, а во втором столбике делаете метки случайным выбором с вероятностью по 0.5

Лучше будет если вы это как-то автоматизируете в рамках своего пакета, поскольку делать это нужно многократно и что-то вычислять каждый раз - одному вам ведомо что.

Никогда ранее не пользовался этим функционалом.

Речь об этой функции?

Генерирует псевдослучайные величины, распределенные по нормальному закону с параметрами mu и sigmа. В случае ошибки возвращает false. Аналог rnorm() в R. 



bool  MathRandomNormal( 
   const double  mu,             // математическое ожидание 
   const double  sigma,          // среднеквадратическое отклонение 
   const int     data_count,     // количество необходимых значений 
   double&       result[]        // массив для получения псевдослучайных величин 
   );
 
 
Aleksey Vyazmikin #:

Как раз я написал о том, что случайный перебор - это и есть непродуктивный подход.

Перебор с элементом случайности выбора предиктора я использую при тестировании потенциала выборки, и уже много лет в CatBoost.

Рандом не даёт каких либо обоснований ожидать, что и дальше будет работать модель, так как в неё случайным образом попали отклики предикторов.

Имеется риск опять погрязнуть в бессмысленных перепалках. Чем отличается случайно найденный сет, работающий на оос, от выдуманного путем тяжелейших ментальных страданий, но тоже без фундаментального обоснования? Когда метод валидации один и тот же. Вопрос риторический.

чем отличается случайный перебор от перебора с элементом случайности выбора? ))
 
Aleksey Vyazmikin #:

Никогда ранее не пользовался этим функционалом.

Речь об этой функции?

Да

 
Aleksey Nikolayev #:

Да

Т.е. мне надо нагенерировать целевую бинарную для выборки, допустим и посмотреть, как часто будут находится квантовые отрезки по моей методики для разных предикторов, и так раз 10?

Если число квантовых отрезков будет найдено примерно столько же в среднем, как и сейчас на всех предикторах, то метод нерабочий, правильно понимаю ход мысли?

 
А не достаточно ли было бы просто перемешать столбец с целевой?
Хвостатость и др. параметры ряда останутся те же. Мне кажется это - плюс.
 
Maxim Dmitrievsky #:

Имеется риск опять погрязнуть в бессмысленных перепалках. Чем отличается случайно найденный сет, работающий на оос, от выдуманного путем тяжелейших ментальных страданий, но тоже без фундаментального обоснования? Когда метод валидации один и тот же. Вопрос риторический.

чем отличается случайный перебор от перебора с элементом случайности выбора? ))

Цель в детекции разрушения правил, а что бы это делать, нужно знать, как они выглядят в правильном виде. Иными словами, какие статистические описательные признаки могут свидетельствовать о том, что это действительно закономерность. Если их знать, то отклонение от этих правил будет сигналом для остановки модели.

И, сбор модели из таких правил, все же представляется более устойчивым решением, чем сбор чистого рандома.

В рандом может попасть пару правил, дающих основной профит, но потом рынок на них может на время забыть. При рандоме это скорей паника и выключение модели при начале слива, а при подходе, предлагаемым мной - ожидание изменения очередности поступления правил, т.е. просадка может быть признана нормальным явлением.

И описанный выше эффект хорошо виден на гифках, что я делал, где в одном случае выборка test в плюсе, а в ином exam - хотя правила все они взяли с выборки train, но их (правил) появление не равномерно по времени.

Бонусом подхода, в идеале, является отказ от выборки exam в полной мере.

Альтернативой может быть - глубокая оценка моделей - есть наработка и в этом направлении.

В итоге пользуясь только рандомной моделью:

1. Мы не знаем, почему она работает.

2. Не знаем, почему она перестала работать.

3. Не знаем, как её "починить".

4. Не знаем, пора ли останавливать торговлю.

5. Время жизни случайной модели будет меньше, так как она содержит ошибочные правила.

При рандоме по факту получаю лично я примерно следующие - из 100 моделей отбирается 30 из 30 в течении полугода в прибыльной зоне примерно 10. Я хочу расклад хотя бы 50% на 50%, тогда можно делать партфели.

 
Forester #:
А не достаточно ли было бы просто перемешать столбец с целевой?
Хвостатость и др. параметры ряда останутся те же. Мне кажется это - плюс.

Можно подробней - я не понял.

 
Aleksey Vyazmikin #:
Вопрос был риторический 
Рандомная модель и модель, полученная случайным перебором - две большие разницы.
Вы всегда путаетесь в показаниях, я уже к этому привык :) 
После получения одной из таких моделей, всегда известны окрестности, для более детального анализа.
Обычно это бессмысленное занятие, поскольку проще запустить новый поиск, но такая возможность всегда есть.

Если вас так пугает неопределенность, то есть абсолютно однозначный поиск абсолютно однозначных паттернов во временных рядах, поверх которых докручивается какая-нибудь тс. Для этого не надо уничтожать здравый смысл, путем переформатирования признаков, а найти паттерны на исходном ВР.
 
Maxim Dmitrievsky #:
Вопрос был риторический 
Рандомная модель и модель, полученная случайным перебором - две большие разницы.
Вы всегда путаетесь в показаниях, я уже к этому привык :) 
После получения одной из таких моделей, всегда известны окрестности, для более детального анализа.
Обычно это бессмысленное занятие, поскольку проще запустить новый поиск, но такая возможность всегда есть.

Если вас так пугает неопределенность, то есть абсолютно однозначный поиск абсолютно однозначных паттернов во временных рядах, поверх которых докручивается какая-нибудь тс. Для этого не надо уничтожать здравый смысл, путем переформатирования признаков, а найти паттерны на исходном ВР.

У Вас нет потребности понять, что я объясняю, а у меня по этой причине нет желания тратит силы на повторное разъяснение. Оставайтесь со своим мнением об идентичности результата при разных подходах.

 
Aleksey Vyazmikin #:

У Вас нет потребности понять, что я объясняю, а у меня по этой причине нет желания тратит силы на повторное разъяснение. Оставайтесь со своим мнением об идентичности результата при разных подходах.

Узрите, ибо если не дан вам паттерн в исконном ряду, то тропа Гильбертова не приведет вас к цели заветной. В бесовщину превратится ваш потуг, и заклание бесславное обрящете, вместо кущ райских.
Причина обращения: