Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3347

 
СанСаныч Фоменко #:

Моя разметка - это приращение цены.

В тот же список.

 
СанСаныч Фоменко #:

Моя разметка - это приращение цены.

Возьмите свою разметку и посмотрите квантиль На какую прибыль рассчитана Ваша разметка? Вот и сравните ее сос статистикой. 

Не, с этим проблем нет. Не важно, на какую прибыль рассчитана. Важно какая потом ошибка классификации. Вот она растет при добавлении спреда в обучение или остается прежней.

Но модель лучше не начинает работать при учете спреда в разметке, не дает профит, а без спреда все так же работает, как если бы была обучена без него. Поэтому я отнес спред, условно, к ошибке классификации. То есть отклик модели не позволяет его побить.

Под учетом спреда в разметке подразумевается длина сделок, которая его превышает. То есть я делаю сделки более длинными, потом обучаю, а результат при тестировании на повышенном спреде почти такой же, как и результат другой модели, обученной на более коротких сделках.

Получается довольно однозначный вывод, что на моих признаках, допустим, МО не может побить спред.

Но иногда может, при определенных махинациях, связанных с козулом. То есть если есть некий стат. показатель выведенной "надежности" сигналов, то они работают и при повышении спреда.

 
Maxim Dmitrievsky #:

Не, с этим проблем нет. Не важно, на какую прибыль рассчитана. Важно какая потом ошибка классификации. Вот она растет при добавлении спреда в обучение или остается прежней.

Но модель лучше не начинает работать при учете спреда в разметке, не дает профит, а без спреда все так же работает, как если бы была обучена без него. Поэтому я отнес спред, условно, к ошибке классификации. То есть отклик модели не позволяет его побить.

Под учетом спреда в разметке подразумевается длина сделок, которая его превышает. То есть я делаю сделки более длинными, потом обучаю, а результат при тестировании на повышенном спреде почти такой же, как и результат другой модели, обученной на более коротких сделках.

Получается довольно однозначный вывод, что на моих признаках, допустим, МО не может побить спред.

Но иногда может, при определенных махинациях, связанных с козулом. То есть если есть некий стат. показатель выведенной "надежности" сигналов, то они работают и при повышении спреда.

Не важно, на какую прибыль рассчитана. Важно какая потом ошибка классификации.

Из-за этого подхода "правильно" классифицируете потенциально убыточные сделки. В реальности ситуация гораздо хуже не только из-за спреда. В реальном советнике добиться из "правильной" классификации прибыльной системе остается проблемой, как это не удивительно.

 
СанСаныч Фоменко #:

Не важно, на какую прибыль рассчитана. Важно какая потом ошибка классификации.

Из-за этого подхода "правильно" классифицируете потенциально убыточные сделки. В реальности ситуация гораздо хуже не только из-за спреда. В реальном советнике добиться из "правильной" классификации прибыльной системе остается проблемой, как это не удивительно.

Сначала разметка делается максимально профитной. Потом ресемплятся и фильтруются "надежные" примеры на основании ошибок модели, остальное размечается как мусор. Потому что понятно, что такой идеальной торговли, как при изначальной граальной разметке никогда не будет (без спреда будет почти грааль). Профитность падает до какого-то уровня, стабильность на новых данных растет. Выбирается баланс между тем и тем.

Вроде логично и не так туманно, как обосновывают свои ТС другие.

самый простой для понимания вариант описал в статье, можете сами проверить, ядро алгоритма простое.

Кросс-валидация и основы причинно-следственного вывода в моделях CatBoost, экспорт в ONNX формат
Кросс-валидация и основы причинно-следственного вывода в моделях CatBoost, экспорт в ONNX формат
  • www.mql5.com
В данной статье предложен авторский способ создания ботов с использованием машинного обучения.
 
Maxim Dmitrievsky #:

Сначала разметка делается максимально профитной. Потом ресемплятся и фильтруются "надежные" примеры на основании ошибок модели, остальное размечается как мусор. Потому что понятно, что такой идеальной торговли, как при изначальной граальной разметке никогда не будет (без спреда будет почти грааль). Профитность падает до какого-то уровня, стабильность на новых данных растет. Выбирается баланс между тем и тем.

Вроде логично и не так туманно, как обосновывают свои ТС другие.

самый простой для понимания вариант описал в статье, можете сами проверить, ядро алгоритма простое.

Бегло посмотрел статью.

Выделил из самого начала некий базовый посыл, на котором строится все остальное:

Если мы обучаем модель много раз на случайных подвыборках, а затем проверяем качество предсказания на каждой и суммируем все ошибки, то получаем относительно достоверную картину случаев, где она на самом деле часто ошибается и случаев, которые часто угадывает.

Совершенно не согласен.

Любая кросс валидация не способна по определению улучшить качество модели. Кросс валидация позволяет вычислить более ДОСТОВЕРНОЕ значение ошибки за счет набора статистики. Все. и полученная ошибка классификации может иметь или не иметь к предсказанию на внешнем файле, т.е. в реальной торговле.

Качество предсказания моделью определяется  набором предикторов для конкретного набора меток и никакого отношения не имеет к модели. До моделированию следует ответить на вопрос: подходят ли друг другу предикторы и их метки? С помощью модели на этот вопрос ответить невозможно, а Вы пытаетесь это сделать.

 
Цирк
 
СанСаныч Фоменко #:

С помощью модели на этот вопрос ответить невозможно, а Вы пытаетесь это сделать.

а с помощью чего вы хотите ответить?

 
Maxim Dmitrievsky #:

а с помощью чего вы хотите ответить?

Старая тема и писал много раз писал.

 
СанСаныч Фоменко #:

Старая тема и писал много раз писал.

Это то же самое
 

поддержыте просмотром, лаком, подпиской разработчика пакета R rusquant


Причина обращения: