Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 887

 
Maxim Dmitrievsky:

это даже не Low latency, hft это милли и даже микросекунды, там каждый лишний метр кабеля на счтеу

у вас обычный скальпинг

Да, я в курсе. Я к тому, что методологию ХФТ можно использовать и на более длинных дистанциях. С некоторой адаптацией.

 
elibrarius:

Вот еще статьи с примерами кода
https://www.mql5.com/ru/users/vlad1949/publications

Я некоторые раза по 3 перечитывал и пробовал как те примеры работают. Ну а потом можно уже и что-то свое мастерить.

Да, спасибо, отлично, читал, но буду ещё - там уж сильно заумно, на каждом уровне обучения нужно возвращаться, а иначе половина слов не ясна.

Но мне бы понять, как новую выборку подгружать в Rattle :)

 
Yuriy Asaulenko:

Да, я в курсе. я к тому, что методологию ХФТ можно использовать и на более длинных дистанциях. С некоторой адаптацией.

ну можно, если тяма есть :D но это уже точно не на форексе, минимум на ECNке

 
Алёша:

Позор мне! Shame!!! Зато теперь 5% ошибки на случайном блуждании, как у крутых!

Неужто осознали, что рынок - это случайное блуждание и это его естественное состояние, а всякие там скачки и пляски - отклонение от нормы.)

 

Добавил такой предиктор как час бара - получился существенный скачек.


Оказалось, что в Deductor Studio в учебной версии не заблокирована выгрузка модели в текстовый файл, а блокировка выгрузки только на всякие красивости в эксель и html. Поэтому имею набор правил такого вида

Возникает вопрос, как теперь удачней эти массивы данных свернуть(организовать) для удобства и быстроты работы?

 
Aleksey Vyazmikin:

Добавил такой предиктор как час бара - получился существенный скачек.


Оказалось, что в Deductor Studio в учебной версии не заблокирована выгрузка модели в текстовый файл, а блокировка выгрузки только на всякие красивости в эксель и html. Поэтому имею набор правил такого вида

Возникает вопрос, как теперь удачней эти массивы данных свернуть(организовать) для удобства и быстроты работы?

Никогда не сворачивал массивы. Объясните, как это делается и главное - зачем?
Погуглил - СвернутьМассив(пМассив) – Убирает повторяющиеся в массиве значения.
Это оно? Убрать дубликаты строк?
 
elibrarius:
Никогда не сворачивал массивы. Объясните, как это делается и главное - зачем?
Погуглил - СвернутьМассив(пМассив) – Убирает повторяющиеся в массиве значения.
Это оно? Убрать дубликаты?

Сейчас гулял и думал, как это сделать... В общем, да предполагаю, что там есть повторения, и их надо будет убрать, но главное меня осенило, что все данные не нужны, а нужны только те, которые подтверждают меньшее из двух 1 или 0. Потом думал упорядочить массивы лесенкой, типа сделав усечение повторяющихся частей... а может надо просто записывать в одну строку, и соответственно так же объединять данные в строку с предикторов(входных данных в реал тайме получаемых), но это пока не выйдем за ограничение длины строки по количеству предиктаров.

 
Aleksey Vyazmikin:

Сейчас гулял и думал, как это сделать... В общем, да предполагаю, что там есть повторения, и их надо будет убрать, но главное меня осенило, что все данные не нужны, а нужны только те, которые подтверждают меньшее из двух 1 или 0. Потом думал упорядочить массивы лесенкой, типа сделав усечение повторяющихся частей... а может надо просто записывать в одну строку, и соответственно так же объединять данные в строку с предикторов(входных данных в реал тайме получаемых), но это пока не выйдем за ограничение длины строки по количеству предиктаров.

Мне кажется повторения нужны, они усилят важность ситуации. Если она 100 раз повторялась в прошлом, вероятно она и в будущем случится, чем та, которая была 1-2 раза
 
Алёша:

Согласен, пайтон - самый топовый ЯП у ХФТшников

для исследований возможно, на продакшне - не верю.

 
elibrarius:
Мне кажется повторения нужны, они усилят важность ситуации. Если она 100 раз повторялась в прошлом, вероятно она и в будущем случится, чем та, которая была 1-2 раза

Так я возьму только те у которых поддержка и достоверность большая. Я так представляю работу - у меня генерируются в индикаторе предикторы в реальном времени и на истории, складываются в строку, а потом эта строка ищется в массиве, если найдена, то помечаем бар как благоприятный для входа, а если нет, то ничего не делаем. Соответственно задвоенные строки только увеличат массив. Нет, ну можно конечно сделать градацию по цвету, где будет информация о достоверности и поддержке (умножив одно на другое получим коэффициент, который в зависимости от значения будет менять цвет), но для этого легче просто сделать отдельный массив типа int с индексом. Или я что-то не понимаю....