Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2758

 
Maxim Dmitrievsky #:
Ресемплинг делается чтобы удалить выбросы, гауссоизировать выборку

Я вообще предлагал осмысленный семплинг по энтропии или корреляции. Чтобы сделать фичи более информативными. Плюс взять приращения и добавить в них максимум информации из исходного ряда всяческими преобразованиями. Плюс нефиксированное запинающееся окно. Это фреш подход и такого никто не делал. Но подхватил какую-то коронавирусную херь и отдыхаю ☺️

Казуал инферннс должен было помочь выбрать информативные фичи, как вариант, но там оказалось не про это

Совершенно не понятно.

Точно знаю, что необходимо разное окно на разных участках временного ряда. Но проблема старая: если подобрать окно на каком-то участке, то совсем не обязательно это окно будет на следующем участке, некий вариант нестационарности ширины окна.

 
СанСаныч Фоменко #:

Совершенно не понятно.

Точно знаю, что необходимо разное окно на разных участках временного ряда. Но проблема старая: если подобрать окно на каком-то участке, то совсем не обязательно это окно будет на следующем участке, некий вариант нестационарности ширины окна.

Голова деревянная, потом сделаю пример
Например, был набор фичей, который предсказал длинное снижение. Тогда нет смысла двигать окно с каждым баром, а подать те же признаки на новом баре. И так до определенной точки, когда оно будет сдвинуто опять. Эти точки тоже заоптить.
 
Maxim Dmitrievsky #:
Там где-то мысля была про фракталы и прочее, что последняя цена не всегда имеет лучшую предсказательную способность. То есть иногда надо останавливать окно по условиям или через другую нс зафитить, чтобы в прогнозе учавствовать предыдущие бары, а не последние. И так оно должно бегать туда-сюда по истории.

Это скорее нефиксированное по времени окно. А как подавали 10 столбцов, так и будем 10.
Пробовал подавать десяток колен ЗЗ (получил как всегда 50%50). Время их формирования всегда разное и последнее колено было сформировано от 1 до нескольких баров назад. Можно сказать, что это преобразование обычных баров в свои. В моем случае колено зигзага формировало бар. С год назад тут вспоминали Прадо, он предлагал перестраивать бары не по времени, а по проторгованному объему например по 100 лотов.


Примеры сырых цен, временных, «объемных» и «долларовых» свечей

 
Maxim Dmitrievsky #:
Голова деревянная, потом сделаю пример
Например, был набор фичей, который предсказал длинное снижение. Тогда нет смысла двигать окно с каждым баром, а подать те же признаки на новом баре. И так до определенной точки, когда оно будет сдвинуто опять. Эти точки тоже заоптить.

Вы переоцениваете важность результатов "вне выборки".

Нельзя верить ни на грош.


"Вне выборки" может  быть что-то даст для идентификации переобученности модели, если будет слишком большая разница (свыше 20% вероятно) между выборкой обучения и вне ее. А так пока я знаю единственное доказательство: небольшое, не более 20% колебание sd предсказательной способности предиктора.

 
СанСаныч Фоменко #:

Вы переоцениваете важность результатов "вне выборки".

Нельзя верить ни на грош.


"Вне выборки" может  быть что-то даст для идентификации переобученности модели, если будет слишком большая разница (свыше 20% вероятно) между выборкой обучения и вне ее. А так пока я знаю единственное доказательство: небольшое, не более 20% колебание sd предсказательной способности предиктора.

elibrarius #:

Это скорее нефиксированное по времени окно. А как подавали 10 столбцов, так и будем 10.
Пробовал подавать десяток колен ЗЗ (получил как всегда 50%50). Время их формирования всегда разное и последнее колено было сформировано от 1 до нескольких баров назад. Можно сказать, что это преобразование обычных баров в свои. В моем случае колено зигзага формировало бар. С год назад тут вспоминали Прадо, он предлагал перестраивать бары не по времени, а по проторгованному объему например по 100 лотов.


Примеры сырых цен, временных, «объемных» и «долларовых» свечей

Плюнуть на предикторы и растереть. Может быть вместе с учителем. 

Надо фантазировать и клепать предикторы десятками, сотнями, а потом отбирать по их влиянию, предсказательной способности, информативной связи с учителем.

 
СанСаныч Фоменко #:

Все, что нужно, закодили до Вас.

 -- а я и не писала, что мне чего-то не хватает в имеющихся либах... ответ предназначался тому, кто от библиотеки ждёт чего-то бОльшего, чем в её кривой трактовке каким-то даже не-комментатором... вот вы бы тоже свои комменты лучше бы  направляли по адресу... (а не в мой ответ, который предназначался не вам)

 
JeeyCi #:

 -- а я и не писала, что мне чего-то не хватает в имеющихся либах... ответ предназначался тому, кто от библиотеки ждёт чего-то бОльшего, чем в её кривой трактовке каким-то даже не-комментатором... вот вы бы тоже свои комменты лучше бы  направляли по адресу... (а не в мой ответ, который предназначался не вам)

Не понял за что, но извиняюсь.

Какая-то совершенно не понятная обида, порожденная моим комментарием.

 
Maxim Dmitrievsky #: 

Казуал инферннс должен было помочь выбрать информативные фичи, как вариант   

не должен был... но это ваш анализ данных - вам виднее

 
Maxim Dmitrievsky #:
Ресемплинг делается чтобы удалить выбросы, гауссоизировать выборку

для чего он делается знаю,

для чего вы его советуете в анализе ВР - не знаю,

как где и когда и использовали ли сами не видела и не вижу смысла и логики и обоснованности в анализе ВР...

 
СанСаныч Фоменко #:

2. Крайне интересно, особенно на энтропии.  Хотелось бы увидеть результат.  Корреляция - это для стационарных рядов, можно забыть.

корреляция выявляет зависимости (при правильном её изучении)...на основе зависимостей таргета от будущих контролируемых, известных, легко предсказуемых (если они таковые) изменений фактора(ов) -- и делается прогноз/предсказание

либо

прогноз делается на основании выявленных закономерностей изменения таргета во времени

== так было всегда

== если вы отвергаете корреляции, это ваше право, но неумение их использовать в анализе по назначению не делает их бесполезными... (я вне постоянных разборок о том, почему вам не нравится слово "корреляция" и что такого некорреляционного, но с какой-то экстрасенсорной "предсказательной способностью" вы изобрели на нобелевскую премию) - просто перекос естественного понятийного аппарата в прогнозировании, сложившегося за несколько веков до вашего появления с вашими экстрасенсорными предсказательными способностями, -- перекашивает саму объективность прогнозирования (которая не запрещает полагаться на выявляемые зависимости в определённых обстоятельствах)

P.S. вам кстати уже намекали

Aleksey Nikolayev #:   

 регрессия уже позволяет сравнивать значимость предикторов. Дальнейшие шаги уже по результатам анализа.

но вы почему-то всё свели к ма-шкам...

Причина обращения: