Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1384

 
Maxim Dmitrievsky:

цена на рынке отражает баланс спроса и предложения в основном, в разные исторические моменты

тут еще одна проблема: сколько истории должно анализироваться при МО ?

если используем некую константу Bars = 1000

то не будет это недостоверными данными для обучения?

 
Maxim Dmitrievsky:

x.append((SD.history[i-j][c.c]/SD.history[i][c.c]-1)*1000)

в этом нет никакого смысла, каждая последующая фича содержит половину полезной информации от предыдущей, т.е. они, 1-е: сильно коррелируют, 2:е - фича с наибольшим лагом содержит всю дисперсию, которая содержится в предыдущих фичах, т.е. они не дают прироста информации

итог будет такой: импортанс у ретурна с самым большим лагом будет наибольший (больше дисперсия, больше прирост информации), и этот ретурн содержит всю дисперсию остальных фичей

В длительном тренде = да. И важность, чем дальше - тем сильнее и корреляция есть, т.к. все растут в одну сторону.

А в такой ситуации:


20-й бар на том же уровне что и 0-й, а вот 5-й и 10-й несут  информации побольше 20-го. И корреляция разве что у 2-3х соседних есть.

Ситуаций много и нужно все бары анализировать.

Как вариант - можно прореживать ряд, как это делал создатель этой ветки (в своем блоге).

 
Maxim Dmitrievsky:

x.append((SD.history[i-j][c.c]/SD.history[i][c.c]-1)*1000)

в этом нет никакого смысла, каждая последующая фича содержит половину полезной информации от предыдущей, т.е. они, 1-е: сильно коррелируют, 2:е - фича с наибольшим лагом содержит всю дисперсию, которая содержится в предыдущих фичах, т.е. они не дают прироста информации

итог будет такой: импортанс у ретурна с самым большим лагом будет наибольший (больше дисперсия, больше прирост информации), и этот ретурн содержит всю дисперсию остальных фичей

Жуть.))
Аналогом того, что я делаю является фотография. 
 
Igor Makanu:

тут еще одна проблема: сколько истории должно анализироваться при МО ?

если используем некую константу Bars = 1000

то не будет это недостоверными данными для обучения?

я так полагаю, что если разбить цену на уровни, то можно посчитать среднюю глубину истории по уровням, начиная с того как цена на него пришла и заканчивая как ушла с него

 
Yuriy Asaulenko:
Я не использую приращения.))

SD.history[i-j][c.c]/SD.history[i][c.c]

Это относительные приращения. Просто вы их по другому называете.

 
elibrarius:

В длительном тренде = да. И важность, чем дольше - тем сильнее и корреляция есть, т.к. все растут в одну сторону.

А в такой ситуации:


20-й бар на том же уровне что и 0-й, а вот 5-й и 10-й несут  информации побольше 20-го. И корреляция разве что у 2-3х соседних есть.

Ситуаций много и нужно все бары анализировать.

Как вариант - можно прореживать ряд, как это делал создатель этой ветки (в своем блоге).

имеется в виду, что при увеличении сэмплов там корреляция будет максимальная, если усреднить

локально никого не интересует

 
Yuriy Asaulenko:
Жуть.))

ну посчитайте корреляцию между своими предикторами, по всей выборке

и потом выкиньте их все )

 
Maxim Dmitrievsky:

ну посчитайте корреляцию между своими предикторами, по всей выборке

и потом выкиньте их все )

Вы не правы. Только так и нужно делать.
 
Yuriy Asaulenko:
Вы не правы. Только так и нужно делать.
 
Ну, ладно. Хотите работать с масштабом зависящим от цены - ваше право.
Причина обращения: