Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 387

 
Dr. Trader:

И можно эти деньги вывести?
 
Dr. Trader:

чем способ заработка.

если хочется заработать, то нумераи вроде как выпустили свою криптомонету. Ее обладатели вроде как имеют возможность опосредованно участвовать в инвестировании.

Более подробно не скажу, все хочу разобраться, но руки никак не доходят.

 
Dr. Trader:

Интересно что при логлоссе 0.690 - 0.691 на валидационных данных почти все показали хороший результат и на новых данных, даже не представляю с чем это связано.

Вероятней всего не по жадничали, не пере усложнили модель и поэтому не переподогнались, хотя был вроде дядька с ~0.65 на каком то туре который на лайв ~0.68+

Меня в ихних данных больше смущает перепутанность сэмплов, "эры" с непонятными id нельзя воспроизвести их вычисления на прошлых турах. То есть хрен знает что в обучающем множестве, было бы не плохо если бы с прошлых туров LIVE сэмплы по которым вычислялся трушный логлос потом выкладывали и можно было натренировать модель под этот тестовый датасет, хотя бы понять почему так расходится. ИМХО они как будто накапливают точки с давних пор а потом как трэйн выдают их рандомный сабсет, причем id-шники не отражают хронологию аккумуляции датасета, а потом live точки которые нужно было ванговать, не дают отдельно чтобы скорректировать модели и получается "пальцем в небо" тыканье, на авось.

Надеюсь они исправятся :)

 
Может ли кто-то подтвердить, что для бинарной классификации лучше использовать случайные леса? В общем случае, или можно подобрать нейросеть в частном случае, которая даст немного меньше ошибку?


 
pantural:
И можно эти деньги вывести?

Да, моментальный вывод биткоинами по текущему курсу.


Комбинатор:

если хочется заработать, то нумераи вроде как выпустили свою криптомонету. Ее обладатели вроде как имеют возможность опосредованно участвовать в инвестировании.

Более подробно не скажу, все хочу разобраться, но руки никак не доходят.

Да, сейчас дают свою крипту победителям вместе с долларами. У меня например накопилось 300 NMR (Numeraire), но сейчас их нельзя вывести или вообще что-то с ними сделать. И вообще они реально эту крипту ещё не запустили в оборот, покачто только раздают.

Сам NMR это токен крипты ethereum (https://github.com/ethereum/EIPs/issues/20), и то инвестирование что они предлагают - тоже основан на возможностях эфира. Точнее это даже не инвестирование, а возможность поставить деньги на свои предсказания. Загружаешь предсказания, делаешь ставку в NMR, а потом алгоритм в эфириуме через время определяет победителей и раздаёт призы (https://numer.ai/whitepaper.pdf). Казино, крч говоря.


Maxim Dmitrievsky:
Может ли кто-то подтвердить, что для бинарной классификации лучше использовать случайные леса? В общем случае, или можно подобрать нейросеть в частном случае, которая даст немного меньше ошибку?
В статьях которые тут выкладывали читал что миром классификации правит градиентный бустинг (особый вид леса), в R пакет gbm например.
 
Dr. Trader:

Да, моментальный вывод биткоинами по текущему курсу.

Хм… странно.

Возникает вопрос зачем американскому хедж-фонду, с покровительством дяди с Ренесанса, где типа как самые крутые кванты на земле, с зп в 200-300к$ и шестизначными бонусами, эти предикшены от любителей ML мира(Россия, Индия, Китай…), по цене зп. одного среднего московского программиста на всю толпу(>300 чел)?????

Будто у них нет своих квантов для этого? Или квантам с гарварда западло этим заниматься, они только для общения с инвесторами, а модели – на аутсорс….

Хмм… как бы они не поплатились за такую не дальновидность…

 
Dr. Trader:


В статьях которые тут выкладывали читал что миром классификации правит градиентный бустинг (особый вид леса), в R пакет gbm например.

Оверфитятся говорят тоже.. но почитаю еще.. Во всяком случае получше MLP. Кстати, boosted decision trees дают ошибку чуть похуже чем простые decision trees в студии 
 
Maxim Dmitrievsky:

Оверфитятся говорят тоже.. но почитаю еще.. Во всяком случае получше MLP. Кстати, boosted decision trees дают ошибку чуть похуже чем простые decision trees в студии 


ada чуть лучше, чем  randomforest. Но в caret какие-то заморочки с ada (не помню какие), поэтому овчинка выделки не стоит.

самое перспективное - это подбор предикторов. Среди наше все.

На этой ветке юзали большое число предикторов, но все производные от одной валютной пары.

А почему одна пара, а не много?

А почему валютная пара, а предикторы не индексы?

А куда делись макроэкономические сведения?


На сегодня у меня ошибка на новом файле чуть меньше 30%. 20% не достижимо никакими ухищрениями, замена моделей ни к чему не приводи.

Но вот попробовать и ответить на выше приведенные вопросы сил нет.

 
СанСаныч Фоменко:


ada чуть лучше, чем  randomforest. Но в caret какие-то заморочки с ada (не помню какие), поэтому овчинка выделки не стоит.

самое перспективное - это подбор предикторов. Среди наше все.

На этой ветке юзали большое число предикторов, но все производные от одной валютной пары.

А почему одна пара, а не много?

А почему валютная пара, а предикторы не индексы?

А куда делись макроэкономические сведения?


На сегодня у меня ошибка на новом файле чуть меньше 30%. 20% не достижимо никакими ухищрениями, замена моделей ни к чему не приводи.

Но вот попробовать и ответить на выше приведенные вопросы сил нет.


Предикторы у меня уже есть, как ни странно. Есть уже готовый бот, который на реале стоит, написал меньше чем за месяц. Самое важное - предикторы, это не обсуждается, да. Ну это у кого в чем опыт есть.. Например, с моей воспаленной фантазией предикторы подбираются на раз, работал аналитиком 5 лет :) Мне видится подбор предикторов не такой сложной задачей как изучение архитектур НС, главное сесть и подобрать, потратить 2-3 недели :) 

в частности, последнее что сейчас популярно это LSTM, они очень требовательны к вычислительным мощностям, но дают офигенный результат. Подумываю сейчас о приобретении мощного игрового компа как минимум, для расчетов на видеокарте, как максимум - NVidia tesla.

Из опыта работы с нс небольшого - их нужно переобучать на автомате или дообучать, это обязательный процесс. Использование ГА для подбора параметров тех же предикторов для НС - тоже обязательное условие. Для всего этого нужны мощности, но это реально стоит того. Получается уже некое подобие AI с учетом 3-х этих компонентов. Переобучение+генетика+мощности

 

СанСаныч Фоменко:

На сегодня у меня ошибка на новом файле чуть меньше 30%. 20% не достижимо никакими ухищрениями, замена моделей ни к чему не приводи.

Очень Высокий результат даже для HFT, не могли бы Вы рас шарить датасет в csv на котором получены такие результаты, хотелось бы убедиться что это не переподгонка. 

С высока и далека иногда доносилось эхо про то что даже у Ренесансов минутные предикты по точности не более 65-70%, с учетом что обучаются они тысячам не мыслимых фичей, в том числе функциям с обработки спутниковых снимков и данных активности городских инфраструктур мегаполисов всего мира, всё что делает природа и толпы людишек на планетке - данные.

Причина обращения: