Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2090

 
Aleksey Vyazmikin:

Если кто сделает выборку с новостями - готов погонять в CatBoost с разными параметрами - эта тема мне интересна.

Я пробовал менять тип трала в зависимости от ожидаемой новости - эффект был хороший, но как то сбор выборки не автоматизирован был.

И да, лучше работает по моим исследованием ожидание новости, чем её выход - плавней что ль...

Форум по трейдингу, автоматическим торговым системам и тестированию торговых стратегий

Машинное обучение в трейдинге: теория, практика, торговля и не только

Valeriy Yastremskiy, 2020.11.05 10:41

архивов реально нет  бесплатных кроме как приложенного, платные тоже не нашел) Ну градация в 3 уровня как бы ничто. к тому же в приложенном архиве нет предварительной оценки. Сам не юзал. Другое увлекло.

Архив отсюда

Все остальное только парсить с сайтов самостоятельно. и пред. оценок тоже нет.

Оценка как оказалось есть. 
 
Valeriy Yastremskiy:
Оценка как оказалось есть. 

Это интересно, почему там 4 столбца с показателями и что в последнем - вообще не понятные цифры.

Я так понимаю, что лучше смотреть на индекс USD, и если там будет движ выявлен, то уже транслировать на конкретную пару...

Мне бы ещё понять, как время трансформировать в московское :)

 
Aleksey Vyazmikin:

Это интересно, почему там 4 столбца с показателями и что в последнем - вообще не понятные цифры.

Я так понимаю, что лучше смотреть на индекс USD, и если там будет движ выявлен, то уже транслировать на конкретную пару...

Мне бы ещё понять, как время трансформировать в московское :)

Форум по трейдингу, автоматическим торговым системам и тестированию торговых стратегий

Машинное обучение в трейдинге: теория, практика, торговля и не только

Aleksey Nikolayev, 2020.11.05 16:08

Переходы там есть - среди новостей обозначенных через N

Поскольку это вроде бы парсинг календаря ФФ, то первые три числа - значение, прогноз, предыдущее пересмотренное; четвёртое - не знаю, может пересмотренное значение вроде бы предыдущее до его пересмотра; последнее целое - из адреса графика.

Время ньюйорка. Переход вроде N должен быть обозначен, и -8 летом и -9 часов зимой, если не перепутал. Хорошо время в секундах можно сделать и с датой можно не париться.
 
Valeriy Yastremskiy:
Время ньюйорка. Переход вроде N должен быть обозначен, и -8 летом и -9 часов зимой, если не перепутал. Хорошо время в секундах можно сделать и с датой можно не париться.

А я думал по Гринвичу время. В РФ надо ещё вспомнить когда и куда часы крутили и крутили ли уже к тому времени - не помню....

А как в секундах, что б не парится - не понял.

 
Aleksey Nikolayev:

Совершенно верно - сокращение от Low, Medium and High Impact Expected. Ещё есть N от Non-Economic - праздники и перевод времени.

Упрощать, наверное, можно, но нужно дополнительное исследование вопроса - может, например, оказаться что Medium по доллару действует сильнее чем High по другой валюте. 

Ещё проблема - в один день может быть много новостей по одной стране - разных по времени, силе и направлению действия. Как-то надо всё это аккуратно "приводить к общему знаменателю")

тут проблем очень много

ну например, а что хотите найти?

формализуйте, что должно произойти? (или не произойти, так сказать нулевая гипотеза....поднахватался на занятиях терминов ))) )

да и в целом, такую задачу, имхо, быстрее в БД посмотреть, примерно как выгрузить ЗигЗаг? с датами в одну таблицу, а во вторую парсинг новостей с категориями важности


но опять же... а что хотим взять в качестве нулевой гипотезы?

 
Rorschach:

1) У цены такой спектр, если брать Фурье от цены максимальная амплитуда будет всегда у медленных колебаний.

2) Медитирую))

На глаз не понятно что с этим делать, возможно МО найдет


1) и чем это плохо?

2) Те ты из той гильдии в которой верят что есть какая то магическая частота которая управляет рынком? :)


Я вижу фурье вообще в другом качестве, в качестве инструмента для распознавания образов..

Можно распознавать образы в евклидовой геометрии , просто берем кусок цены --- нормализируем --- ищем похожие 

Но это довольно таки грубый метод сравнения..

Чем тут хорош фурье, вот какие я вижу преимущества 

1) у него абсолютно четкие и однозначные параметры амплитуда\частота\фаза, те никаких вольностей и это хорошо

2) из паттерна можно удалять\добавлять\изменять(фильтровать) какие то гармоники, тем самым можно добиться более тонкой настройки в поиске подобия и это хорошо

и вишенка на торте

3) если нормализировать амплитуды гармоник относительно соседних, а также и частоты, то мы получим инвариантность к размерам паттерна, те сеть будет видеть и понимать один и тот же паттерн хоть с тиков хоть с месячного ТФ, это должно работать даже круче чем сверточные сети, и это афигенно ))

 
Igor Makanu:

Помню ты как то генетикой искал где ордера открывать, что пошло не так ? )

 
Aleksey Vyazmikin:

А я думал по Гринвичу время. В РФ надо ещё вспомнить когда и куда часы крутили и крутили ли уже к тому времени - не помню....

А как в секундах, что б не парится - не понял.

Там указано, время ньюйорка, его надо привести к терминальному времени тестера.

Извиняюсь, не можно, оно и так в секундах с 70 го года в МКЛ.) И если переводить то просто вычитать, а если в дата, часы переводить время, надо париться и изменение даты учитывать.)  

 
Igor Makanu:

тут проблем очень много

ну например, а что хотите найти?

формализуйте, что должно произойти? (или не произойти, так сказать нулевая гипотеза....поднахватался на занятиях терминов ))) )

да и в целом, такую задачу, имхо, быстрее в БД посмотреть, примерно как выгрузить ЗигЗаг? с датами в одну таблицу, а во вторую парсинг новостей с категориями важности


но опять же... а что хотим взять в качестве нулевой гипотезы?

В моём подходе всё стандартно) нулевая гипотеза - цена ведёт себя как СБ. Если мы говорим о зигзаге, то величина Z=z/m-1, где z - длина колена зигзага, а m - его параметр, в случае СБ имеет экспоненциальное  распределение с единичным параметром. Это и будет нулевая гипотеза. Соответственно, альтернативная гипотеза будет отвержением этого утверждения.

 
Igor Makanu:

тут проблем очень много

ну например, а что хотите найти?

формализуйте, что должно произойти? (или не произойти, так сказать нулевая гипотеза....поднахватался на занятиях терминов ))) )

да и в целом, такую задачу, имхо, быстрее в БД посмотреть, примерно как выгрузить ЗигЗаг? с датами в одну таблицу, а во вторую парсинг новостей с категориями важности


но опять же... а что хотим взять в качестве нулевой гипотезы?

В общем разговор как раз о сложностях формализации на простые задачи. И новости имеют разную силу и направленность, и действие новости на цену имеет разный отклик. Вариантов много, и этапов.  Можно взять одинаковые по силе новости и только сонаправленные  и смотреть отклики, можно только разнонаправленные и смотреть силу действия. И как смотреть, можно искать изменение скорости канала, можно зигзаг, можно некую среднюю, проблема масштаба времени так же. И это все нужно разбить на простые модели исследования.

Ну в общем как хорошее вино, или сыр сделать. Зависит не только от порядка что зачем кладешь и сколько, но и от кучи других не видных глазу, и без возможности пощупать факторов)