Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 387
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
чем способ заработка.
если хочется заработать, то нумераи вроде как выпустили свою криптомонету. Ее обладатели вроде как имеют возможность опосредованно участвовать в инвестировании.
Более подробно не скажу, все хочу разобраться, но руки никак не доходят.
Интересно что при логлоссе 0.690 - 0.691 на валидационных данных почти все показали хороший результат и на новых данных, даже не представляю с чем это связано.
Вероятней всего не по жадничали, не пере усложнили модель и поэтому не переподогнались, хотя был вроде дядька с ~0.65 на каком то туре который на лайв ~0.68+
Меня в ихних данных больше смущает перепутанность сэмплов, "эры" с непонятными id нельзя воспроизвести их вычисления на прошлых турах. То есть хрен знает что в обучающем множестве, было бы не плохо если бы с прошлых туров LIVE сэмплы по которым вычислялся трушный логлос потом выкладывали и можно было натренировать модель под этот тестовый датасет, хотя бы понять почему так расходится. ИМХО они как будто накапливают точки с давних пор а потом как трэйн выдают их рандомный сабсет, причем id-шники не отражают хронологию аккумуляции датасета, а потом live точки которые нужно было ванговать, не дают отдельно чтобы скорректировать модели и получается "пальцем в небо" тыканье, на авось.
Надеюсь они исправятся :)
И можно эти деньги вывести?
Да, моментальный вывод биткоинами по текущему курсу.
если хочется заработать, то нумераи вроде как выпустили свою криптомонету. Ее обладатели вроде как имеют возможность опосредованно участвовать в инвестировании.
Более подробно не скажу, все хочу разобраться, но руки никак не доходят.
Да, сейчас дают свою крипту победителям вместе с долларами. У меня например накопилось 300 NMR (Numeraire), но сейчас их нельзя вывести или вообще что-то с ними сделать. И вообще они реально эту крипту ещё не запустили в оборот, покачто только раздают.
Сам NMR это токен крипты ethereum (https://github.com/ethereum/EIPs/issues/20), и то инвестирование что они предлагают - тоже основан на возможностях эфира. Точнее это даже не инвестирование, а возможность поставить деньги на свои предсказания. Загружаешь предсказания, делаешь ставку в NMR, а потом алгоритм в эфириуме через время определяет победителей и раздаёт призы (https://numer.ai/whitepaper.pdf). Казино, крч говоря.
Может ли кто-то подтвердить, что для бинарной классификации лучше использовать случайные леса? В общем случае, или можно подобрать нейросеть в частном случае, которая даст немного меньше ошибку?
Да, моментальный вывод биткоинами по текущему курсу.
Хм… странно.
Возникает вопрос зачем американскому хедж-фонду, с покровительством дяди с Ренесанса, где типа как самые крутые кванты на земле, с зп в 200-300к$ и шестизначными бонусами, эти предикшены от любителей ML мира(Россия, Индия, Китай…), по цене зп. одного среднего московского программиста на всю толпу(>300 чел)?????
Будто у них нет своих квантов для этого? Или квантам с гарварда западло этим заниматься, они только для общения с инвесторами, а модели – на аутсорс….
Хмм… как бы они не поплатились за такую не дальновидность…
В статьях которые тут выкладывали читал что миром классификации правит градиентный бустинг (особый вид леса), в R пакет gbm например.Оверфитятся говорят тоже.. но почитаю еще.. Во всяком случае получше MLP. Кстати, boosted decision trees дают ошибку чуть похуже чем простые decision trees в студии
Оверфитятся говорят тоже.. но почитаю еще.. Во всяком случае получше MLP. Кстати, boosted decision trees дают ошибку чуть похуже чем простые decision trees в студии
ada чуть лучше, чем randomforest. Но в caret какие-то заморочки с ada (не помню какие), поэтому овчинка выделки не стоит.
самое перспективное - это подбор предикторов. Среди наше все.
На этой ветке юзали большое число предикторов, но все производные от одной валютной пары.
А почему одна пара, а не много?
А почему валютная пара, а предикторы не индексы?
А куда делись макроэкономические сведения?
На сегодня у меня ошибка на новом файле чуть меньше 30%. 20% не достижимо никакими ухищрениями, замена моделей ни к чему не приводи.
Но вот попробовать и ответить на выше приведенные вопросы сил нет.
ada чуть лучше, чем randomforest. Но в caret какие-то заморочки с ada (не помню какие), поэтому овчинка выделки не стоит.
самое перспективное - это подбор предикторов. Среди наше все.
На этой ветке юзали большое число предикторов, но все производные от одной валютной пары.
А почему одна пара, а не много?
А почему валютная пара, а предикторы не индексы?
А куда делись макроэкономические сведения?
На сегодня у меня ошибка на новом файле чуть меньше 30%. 20% не достижимо никакими ухищрениями, замена моделей ни к чему не приводи.
Но вот попробовать и ответить на выше приведенные вопросы сил нет.
Предикторы у меня уже есть, как ни странно. Есть уже готовый бот, который на реале стоит, написал меньше чем за месяц. Самое важное - предикторы, это не обсуждается, да. Ну это у кого в чем опыт есть.. Например, с моей воспаленной фантазией предикторы подбираются на раз, работал аналитиком 5 лет :) Мне видится подбор предикторов не такой сложной задачей как изучение архитектур НС, главное сесть и подобрать, потратить 2-3 недели :)
в частности, последнее что сейчас популярно это LSTM, они очень требовательны к вычислительным мощностям, но дают офигенный результат. Подумываю сейчас о приобретении мощного игрового компа как минимум, для расчетов на видеокарте, как максимум - NVidia tesla.
Из опыта работы с нс небольшого - их нужно переобучать на автомате или дообучать, это обязательный процесс. Использование ГА для подбора параметров тех же предикторов для НС - тоже обязательное условие. Для всего этого нужны мощности, но это реально стоит того. Получается уже некое подобие AI с учетом 3-х этих компонентов. Переобучение+генетика+мощности
СанСаныч Фоменко:
На сегодня у меня ошибка на новом файле чуть меньше 30%. 20% не достижимо никакими ухищрениями, замена моделей ни к чему не приводи.
Очень Высокий результат даже для HFT, не могли бы Вы рас шарить датасет в csv на котором получены такие результаты, хотелось бы убедиться что это не переподгонка.
С высока и далека иногда доносилось эхо про то что даже у Ренесансов минутные предикты по точности не более 65-70%, с учетом что обучаются они тысячам не мыслимых фичей, в том числе функциям с обработки спутниковых снимков и данных активности городских инфраструктур мегаполисов всего мира, всё что делает природа и толпы людишек на планетке - данные.