Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2737

 
Aleksey Nikolayev #:

Дискретизация для анализа необходима, без неё никак. Обычно, временным рядом называют дискретизацию через равные промежутки времени. Но можно же делать её и по другому - ренко или зигзаги, например.

В моём представлении, источник дискретизации у нас - тупая базовая ТС, которую мы потом пытаемся улучшить посредством фильтров из наших моделей. Например, исходная ТС "покупать в начале часа и продавать в конце" или "открывать при формировании колена зигзага в его направлении и закрывать при формировании следующего", а итоговая ТС на основе каких-то индикаторов-предикторов отбрасывает некоторые входы.

Вы считаете возню с разными способами дискретизации пустым баловством и в этом есть некоторый резон, но всегда найдутся несогласные с вами. Это ещё одна причина невозможности конструктивного обсуждения в ветке какой-либо конкретики.

Ну я могу только выражать своё мнение. Например, пробовал строить разные виды баров на основе тиков по разным условиям и ничего этим не добился. На этом этапе пока все понятно, можно вести конструктив беседу, если не вводить кучу лишних терминов :)

Сейчас я просто беру случайный набор признаков и меток и перебираю эти наборы с проверкой на новых данных. Ещё пытаюсь выводить метки на основе взаимной информации, чтобы было как можно больше информации между ними и признаками, либо корреляция.
 
Aleksey Nikolayev #:

Вы считаете возню с разными способами дискретизации пустым баловством и в этом есть некоторый резон, но всегда найдутся несогласные с вами. Это ещё одна причина невозможности конструктивного обсуждения в ветке какой-либо конкретики.

Дискретизация это частный случай фильтрации(сжатия информации) если бы это не было полезно, то этого и не было бы вообще.. Считать это баловством это быть идиотом,  что не удивляет 
МО професура ахаха
 
Aleksey Vyazmikin #:

Я то вообще придерживаюсь мнения, что это всё бесполезно, и чем больше выборка - тем лучше, но готов проверить это, а для этого и нужен подходящий инструмент. Инструмент, который определит оптимальные участки для обучения модели, пусть в начале на истории, а потом посмотрим, может можно сделать без подглядывания в будущее.

Алексей это задача на обычный перебор, все как ты любиш,  в чем проблема? 
 
mytarmailS #:
Дискретизация это частный случай фильтрации(сжатия информации) если бы это не было полезно, то этого и не было бы вообще.. Считать это баловством это быть идиотом,  что не удивляет 
МО професура ахаха
У тебя в одном месте сильно подгорает и сжимается при слове фильтрация, но, как говорится, слабоумие и отвага не позволяют тебе отличать одно от другого 

Недавно выйдя из пту и наскоком пытаясь в науку, не стоит ждать быстрого эффекта, кроме как перед корешами за пивасиком блеснуть 

Забыл.. нейросети у тебя тоже фильтры.. по ходу нефильтрованным злоупотребляешь 
 
Maxim Dmitrievsky #:
Недавно выйдя из пту и наскоком пытаясь в науку, не стоит ждать быстрого эффекта, кроме как перед корешами за пивасиком блеснуть 
Вот вот, читай себе это перед сном каждый вечер..  Не лезь туда где ты ноль..

Я вот умею дискретизировать чтобы улучшить модель,  а тебе назад в пту((

МО професура ахаха)) 
 
Maxim Dmitrievsky #:
А где вы шум увидели в клоуз ценах и чем они хуже Машки. Не даёт эффекта. Рандом поделённый на рандом 

Это, наверное, один из первых способов, который побежит проверять неофит в МО и обломается

Как я там писал.. сначала нужно определить объект исследования и его свойства, а потом причинно-следственную связь с помощью МО (если она есть)

МО это безболезненной способ проверки гипотез на новых данных. А эти бегают и орут что у них ниче не работает.

МА-шки в некотором плане лучше:

0. цена Close наследует шум от тиков. Буквально - успел тик сгенерироваться до закрытия бара или нет, щёлкнул ли где-то таймер. Плюс-минус пара тройка пунктов. Это на бирже днёвки имеют значимые Open/Close. 

1. MA они уже интегральные (да - средние)

2. вполне адекватно представляют цену. (я потому и указал что сдвиг LWMA на чуть больше 1/3, на треть это ровно актуальная сглаженная цена без лишнего шума)

3. их удобнее сравнивать и можно нормировать

---

наконец - и какой-же у вас объект исследования ? 

 
Maxim Kuznetsov #:

есть подозрения что некоторые персоны форума, а уж тем более наполнение  сайтов "выгодные советники и сигналы" это результат ИИ. То есть NN вполне зарабатывают на теме около-трейдинг.

Совершенно точно нейросети и биг-дата зарабатывают (торговлей) на анализе трендов социалочек. От того и спонсируются, и потому несколько однобоко развиваются; но это не по нашим возможностям :-(

Спасибо за ответ

 
Maxim Dmitrievsky #:
Если тему не подогревать хотя бы раз в месяц, то она умрет и на форуме станет скучно 

Например, СанСаныч озвучил интересные мысли, которые имеются также в моей голове, поэтому респект и уважуха, я получил некоторое одобрение неявно от профи в МО

ССФ мало что нового высказал, конечно цель найти корреляцию признаков предикторов и результата это очевидная цель. Новое уловил только, что у него порядка 200 найденных значимых признаков на всем обучении, но для конкретных данных, ряда он использует всего лишь 5 процентов от них. 

Понимаю это так, что есть некие способы быстро определить состояние / свойства ряда для отбора более значимых предикторов именно для последних данных. Вопрос обьема или длинны конечно возникает для правильного отбора. Но видимо это работает даже всего лишь на 200 найденных и отобранных предикторов на всем большом обучении.

Понимаю в общем это так. На разных участках ряд имеет стабильные по некоторым показателям свойства, но на разных участках эти показатели и их количество различны. МО находит некие различные состояния достаточной продолжительности стабильности ряда, которые можно описать разными моделями и соответственно настройками модели - предикторами. Общее количество предикторов это общее количество настроек для разных моделей, и соответственно определяя модель, можно быстро найти ранее найденные для нее настройки.

Если экстенсивно развивать, то увеличивать общее количество предикторов и число моделей.

Согласен с ССФ, что на сегодня доступные и приемлимые для обработки данные это котировки, формализация других данных это наука, хоть и перспективная.

 
Maxim Kuznetsov #:

МА-шки в некотором плане лучше:

0. цена Close наследует шум от тиков. Буквально - успел тик сгенерироваться до закрытия бара или нет, щёлкнул ли где-то таймер. Плюс-минус пара тройка пунктов. Это на бирже днёвки имеют значимые Open/Close. 

1. MA они уже интегральные (да - средние)

2. вполне адекватно представляют цену. (я потому и указал что сдвиг LWMA на чуть больше 1/3, на треть это ровно актуальная сглаженная цена без лишнего шума)

3. их удобнее сравнивать и можно нормировать

---

наконец - и какой-же у вас объект исследования ? 

Согласен с Максом, короткие средние и прореженные данные одинаковы для исследования по количеству шума и полезного сигнала в нашем дискретном случае.

Объект исследования - приращения, если не ошибаюсь)))

 
Valeriy Yastremskiy #:

ССФ мало что нового высказал, конечно цель найти корреляцию признаков предикторов и результата это очевидная цель.

СФ и МД болеют идеей про связь целевой с признаками, один заболел давно, другой только начал..
Им в голову не приходит что любой алгоритм по отбору признаков этим и занимается, и таких алгоритмов уже наплодили десятки точно.. 
Но..  Птушник верит в свою гениальность и твёрдо верит что он что то создаёт новое, уникальное... 
И несут они эту идею как некое открытие,  как свой интеллектуальный труд
ЦИРК...  Професура МО)))) 

Причина обращения: