Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 582

 
Grigoriy Chaunin:

Узнал что в машинном обучении используется такая вещь как конструирование признаков. На одной цене далеко не уедешь. Признак в нашем случае это некая функция от цены. Вопрос в том какие функции использовать. Тупо перебирать индикаторы с разными параметрами не вариант. Интересны материалы по этой теме. Гугл как всегда выдает всякую фигню, вернее ничего не выдает по теме. Искал в рунете. Может кто-нибудь знает материалы по теме.

ПС. Начинать нужно сначала. Вот когда научился конструировать признаки не на обум, можно переходить к их отбору.

Посмотрите это, это, это и может это.

Удачи и больше читайте.

 
Maxim Dmitrievsky:

Максим, а ты внимательно читаешь посты некоего Vizard_? Этот дядя лабает гениальные вещи - посмотри в мою ветку.

 
Vladimir Perervenko:
Посмотрите это, это, это и может это.

Удачи и больше читайте.


я это все читал, проблема то в том, что значимость признаков сильно варьируется от выборки к выборке, и все эти манипуляции хороши для статанализа а не для реального трейдинга

обычная оптимизация, другими словами

Ой, это не мне.. сорри :D

 
Alexander_K2:

Максим, а ты внимательно читаешь посты некоего Vizard_? Этот дядя лабает гениальные вещи - посмотри в мою ветку.


да, но он настолько превосходен что я не затащу на данном этапе :) + он писал, что более 20% годовых зарабатывать невозможно.. Наверное, начинать всегда следует с таких заявлений, а потом углубляться в подробности :)

 
Vladimir Perervenko:
Посмотрите это, это, это и может это.

Удачи и больше читайте.


Понял что ответа на свой вопрос не найду. Там где удалось почитать пишут что это искусство. Проблема в том что индикаторов масса, а параметров которые им можно задать еще больше. Проверить все возможные комбинации методом перебора? Я не представляю как это сделать. Все равно нужны правила первичного отбора, а затем уже работать с выбранными индикаторами по методам отбора признаков.

 
Maxim Dmitrievsky:

я это все читал, проблема то в том, что значимость признаков сильно варьируется от выборки к выборке, 

А вы уверены, что признаки вообще существуют? Или, например, их может быть оч много и разных. Естественно, в этом случае,перебором и всякими комбинациями их не возьмешь, и единственный путь, чтобы система определяла их сама. В этом свете, поиск неких предикторов и их сочетаний выглядит безумным занятием (ну, на истории мы, разумеется, их всегда успешно найдем.))

Я вижу здесь только один путь - система должна выявлять это множество признаков самостоятельно при обучении, и не для Вас, а для самой себя. А наша задача, только подготовка данных для обучения. Единственная задача такой подготовки - как-бы сообщить системе некоторые априорные данные, таким образом сократив область применимости системы. Или, другими словами, отсечь интервалы, где сделки явно нецелесообразны.

Мы должны только четко сформулировать задачу, но не пытаться решать ее за систему. Имхо, там слишком все сложно, чтобы даже пытаться решить это перебором.

 
СанСаныч Фоменко:

Хочу заметить, что ada дает лучше результат, чем rf: и точнее и менее склонна к переобучению. И пользоваться надо ada, а не rf. 

Так что не просто так все в кучу.

С GARCH заело - слишком сложно. Пока пробился через ARIMA, а еще GARCH и распределение.

Завел нас СанСаныч в дремучие случайные леса и там бросил, а теперь говорит, что в лес вообще ходить было не надо. Ну, просто Сусанин.

А я только было собрался ими заняться.)

 
Yuriy Asaulenko:

А вы уверены, что признаки вообще существуют? Или, например, их может быть оч много и разных. Естественно, в этом случае,перебором и всякими комбинациями их не возьмешь, и единственный путь, чтобы система определяла их сама. В этом свете, поиск неких предикторов и их сочетаний выглядит безумным занятием (ну, на истории мы, разумеется, их всегда успешно найдем.))

Я вижу здесь только один путь - система должна выявлять это множество признаков самостоятельно при обучении, и не для Вас, а для самой себя. А наша задача, только подготовка данных для обучения. Единственная задача такой подготовки - как-бы сообщить системе некоторые априорные данные, таким образом сократив область применимости системы. Или, другими словами, отсечь интервалы, где сделки явно нецелесообразны.

Мы должны только четко сформулировать задачу, но не пытаться решать ее за систему. Имхо, там слишком все сложно, чтобы даже пытаться решить это перебором.

я ни в чем никогда не уверен :)

ну ок, допустим что основной признак - это сама цена. Наша задача (допустим, классификации) найти такое сочетание бай/селлов, что бы оно было устойчивым на истории и давало профит, так? и соответствующий этим сделкам бэкграунд в виде какой-то модели. В то же время, вы, например, сами используете некий набор признаков (около 20). чем это обусловлено? И как заставить систему саму выделить эти признаки?

По сути, это обычная оптимизационная задача без шансов на "искуственный интеллект". У меня полно версий таких систем, последнюю вчера доделал. Результат такой же - нестабильная работа вне выборки, и возможность достичь почти 100% точности на обучении, и любой точности (на выбор), но уменьшение точности не говорит о меньшей переобученности. Причем, для этого не надо использовать R и сложные заумные модели, результат будет точно такой же.

 
Maxim Dmitrievsky:

да, но он настолько превосходен что я не затащу на данном этапе :) + он писал, что более 20% годовых зарабатывать невозможно.. Наверное, начинать всегда следует с таких заявлений, а потом углубляться в подробности :)

Ну, не знаю. Я 20% за 2,5 дня накропал. И это при 2-х убыточных сделках.
 
Maxim Dmitrievsky:

я ни в чем никогда не уверен :)

ну ок, допустим что основной признак - это сама цена. Наша задача (допустим, классификации) найти такое сочетание бай/селлов, что бы оно было устойчивым на истории и давало профит, так? В то же время, вы, например, сами используете некий набор признаков (около 20). чем это обусловлено? И как заставить систему саму выделить эти признаки?

С чего Вы это взяли? Откуда?

Для системы я не использую признаков. Признаками я только отсекаю от временного ряда (и от обучения и от функционирования) участки, где анализировать ничего вообще не надо.

Сама НС у меня жует непосредственно временной ряд.

Уже писал и даже цитировал книгу -НС хорошо выполняет узкоспециализированные задачи в сочетании с обычными методами.