Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1383

 
Возьмите цену в процентах от последних 100 цен.    Не то ?
 
Evgeniy Chumakov:
Возьмите цену в процентах от последних 100 цен.    Не то ?
Это аналогично делению
 

что бы вообще не было потери информации, приращения не годятся на роль фичей ни в каком виде (кроме, возможно, их суммы, специально подобранной, на что нужно тоже потратить время)

нужно разделить график на уровни, одинаковые куски а может и не одинаковые, по вертикали, и каждый кусок номрмировать в диапазон.  Ну то есть аналог обычных ценовых уровней. А не нормировать весь ряд целиком или же в скользящем окне - это будет опять потеря очень важной инфы.

но при разделении на уровни возникает другая проблема - когда цена будет находиться в пограничных состояниях, или если для обучения берется много последних цен, одни из которых находятся на одном "уровне", а другие на другом. Пока не придумал как делать.

там еще может понадобиться отображение уровней в зеркальном виде по отношению друг к другу, что бы переходы между ними были более безболезненными

естественно, что самым информативным все равно останется непреобразованный график. Поэтому, с любыми преобразованиями надо быть очень осторожным - кач-во модели будет падать пропорционально вашему невежеству. Отсюда все сказки про то что 50% ошибки это нормально и проч. ерунде, модель просто ничему не учится на таких "фичах"

 

Что-то вы сложное придумали, непонятно зачем и действительно непонятно - как такое сделать.

У Юрия и с простыми приращениями все получается

 

x.append((SD.history[i-j][c.c]/SD.history[i][c.c]-1)*1000)

в этом нет никакого смысла, каждая последующая фича содержит половину полезной информации от предыдущей, т.е. они, 1-е: сильно коррелируют, 2:е - фича с наибольшим лагом содержит всю дисперсию, которая содержится в предыдущих фичах, т.е. они не дают прироста информации

итог будет такой: импортанс у ретурна с самым большим лагом будет наибольший (больше дисперсия, больше прирост информации), и этот ретурн содержит всю дисперсию остальных фичей

 
elibrarius:

У Юрия и с простыми приращениями все получается

этого не может быть потому что не может быть никогда

 
elibrarius:

Что-то вы сложное придумали, непонятно зачем и действительно непонятно - как такое сделать

представьте ситуацию.

цена на рынке отражает баланс спроса и предложения в основном, в разные исторические моменты

Вы в качестве фичей суете ограниченный нормированный участок истории, отражающий только текущую ситуацию

Разные исторические моменты вашей моделью сливаются в один нормированный безликий поток (все рыночные ситуации приравниваются друг к другу), который уже не содержит ни исторических последовательностей, ни справедливой цены

у вас остается куча одинаковых шаблонных нормализованных паттернов, которые перекрываются при увеличении глубины истории, что приводит к ошибке 50 на 50.  Вы не учите модель ничему, выкидываете самую важную информацию еще при препроцессинге, потому что делаете все не правильно, т.е. по книжкам, предназначенным для совсем других задач и описывающим совершенно другие процессы.

Котировка это никакой не сигнал, это совершенно другой процесс, с ним нельзя так работать. Юрий радиофизик, например, и ему поэтому ничего другого не остается.

В таком обучении вы учитываете время, но не учитываете цену. Уровень цены (выше\ниже) на рынке является даже более важной инфой чем время, т.к. отражает баланс спроса\предложения, в котором отражена вся основная рын. инфа.
 
Maxim Dmitrievsky:

представьте ситуацию.

цена на рынке отражает баланс спроса и предложения в основном, в разные исторические моменты

Вы в качестве фичей суете ограниченный нормированный участок истории, отражающий только текущую ситуацию

Разные исторические моменты вашей моделью сливаются в один нормированный безликий поток (все рыночные ситуации приравниваются друг к другу), который уже не содержит ни исторических последовательностей, ни справедливой цены

у вас остается куча одинаковых шаблонных нормализованных паттернов, которые перекрываются при увеличении глубины истории, что приводит к ошибке 50 на 50.  Вы не учите модель ничему, выкидываете самую важную информацию еще при препроцессинге, потому что делаете все не правильно, т.е. по книжкам, предназначенным для совсем других задач и описывающим совершенно другие процессы.

Котировка это никакой не сигнал, это совершенно другой процесс, с ним нельзя так работать. Юрий радиофизик, например, и ему поэтому ничего другого не остается.

В таком обучении вы учитываете время, но не учитываете цену. Уровень цены (выше\ниже) на рынке является даже более важной инфой чем время, т.к. отражает баланс спроса\предложения, в котором отражена вся основная рын. инфа.

Жаль, что нельзя ставить "Like"

 
Vitaly Muzichenko:

Жаль, что нельзя ставить "Like"

можно просто деньгами )) шучу

 
elibrarius:

У Юрия и с простыми приращениями все получается

Я не использую приращения.))