Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2830

 
Maxim Dmitrievsky #:
Есть полный перебор, а есть оптимизация. Она нужна для сокращения времени поиска оптимального решения. Поскольку это так, то это всегда компромисс. Можно оптимизировать методом стохастического градиента и получить результат лучше, чем через adam, но пожертвовав временем. И приходится выбирать. Для каких-то задач точность может оказаться важнее скорости, например повысить матожидание ТС.
Здесь интересно как раз посмотреть на наглядные результаты.

Важный вопрос - что оптимизировать. Хотелось бы оптимизировать осмысленные критерии завязанные на прибыль, просадку, волатильность и тд.

Полный перебор - лучший способ оптимизации) Жаль не всегда применимый)

 
Aleksey Nikolayev #:

Важный вопрос - что оптимизировать. Хотелось бы оптимизировать осмысленные критерии завязанные на прибыль, просадку, волатильность и тд.

Полный перебор - лучший способ оптимизации) Жаль не всегда применимый)

я бы процитировал лозунг "бороться и искать - найти и перепрятать"

задавать как кастомную метрику любой критерий, в частности вот эти стандартные. Оптимизировать все равно по логлосс будет, но останавливаться будет по этим кастомным, что, наверное, имеет какой-то смысл

и действительно имеет, потому что останов в том же бустинге всегда по какому-то кастовому критерию типа accuracy 

 
Aleksey Nikolayev #:

Подробно вопрос не изучал. Идея вроде несложная, но полно технических тонкостей в способах реализации. 

Тут еще вопрос что иметь ввиду под поиском максимума в зашумленной функции..

Как я понял определение  - "оптимизация зашумленной функции" это типа имееться в виду что просто функция сложной формы и в ней тяжело искать максимум, градиентные алгоритмы не применимы ну и выводы далее.. Те грубо говоря ниче страшного , применил алг. глобальной оптимизации и он пошел искать глобальный максимум...


А я вот смотрю по другому , я хочу найти максимум шумной функции но с удаленным шумом, те не глобальный максимум в шумной функции, а глобальный максимум в обезшумленой функции..

(это мой вопрос)  И это уже не тривиально, ведь функция то неизвесна, и параметры шума тоже..

What optimization algorithm can be used to find the maximum in a noisy multidimensional parameter space
What optimization algorithm can be used to find the maximum in a noisy multidimensional parameter space
  • 2022.12.07
  • mr.T mr.T 113 6 6 bronze badges
  • stats.stackexchange.com
I tried several algorithms that seem to be able to handle this, but it didn't work for me. Here is my fitness function which just looks for the max by index
 
СанСаныч Фоменко #:

1. Вопрос Дика - совершенно правомерный и правильный вопрос. Я не использую НС, но я точно знаю, что любая функция в любом пакете R обязательно содержит ссылку на автора алгоритма, а для серьезных алгоритмов, ссылку на статью/книгу, в которой изложен алгоритм, реализованный на R. Так как Вы хорошо знакомы с НС, то, если бы Вы пользовались R, то могли поискать в  R соответствующий тип НС и найти соответствующую ссылку, по которой описан соответствующий алгоритм, найти дискуссию по алгоритму, выяснить все нюансы профессионалов ... и ответить Дику на самом высоком профессиональном уровне, а не мямлить что-то неприличное. 


2. R по названию: язык статистики и графики. Суть R раскрывает рубрикатор его справочного аппарата.

Здесь перечень тем, который покрывают пакеты R. Одной из тем является машинное обучение.

Здесь перечень пакетов, относящихся к МО.

Еще несколько лет назад можно было встретить конкурентов R среди других специализированных языков статистики. Например, SPPS, на сегодня не нашел. R остался единственным языком статистики, поддерживается и модерируется, имеет огромное число зеркал, включен в состав программного обеспечения Майкрософт.


3.  Сравнение R с Питоном совершенно неправомерно.

R - специализированный язык. Питон - универсальный язык. Питон намного превосходит R по числу пользователей, но массовый пользователь Питона - это web дизайн. То, что в Питоне имеются пакеты статистики - это НЕ позволяет его отнести к языкам статистики. На таком основании к языкам статистики можно отнести  С++, на котором реализованы пакеты, используемые как R  так и на Питоне. За счет своего подробного рубрикатора и ссылок на алгоритмы предлагаемый функций  R можно использовать для изучения теории и практики статистики, а  Питон - нет. 

А здесь я процитирую Прадо, но не дословно, т.к. забыл, что "Машинное обучение дает больше возможностей по сравнению с классической статистикой, в трейдинге"

и МО библы очень хорошо развиты для питона, хотя и остальные типа statsmodels тоже. Поэтому спорить с этими фактами и доказывать что-то друг другу бессмысленно.

В моем понимании, R для студентов и преподов и любителей. Чтобы можно было цитировать друг друга и хвастаться чем-нибудь. Для профессуры может какой-то, которая преподает.  Питон для серьезных проектов и продакшна. Не слышал ни о каком крупном МО проекте на R в продакшне.
 
Maxim Dmitrievsky #:

А здесь я процитирую Прадо, но не дословно, т.к. забыл, что "Машинное обучение дает больше возможностей по сравнению с классической статистикой, в трейдинге"

и МО библы очень хорошо развиты для питона, хотя и остальные типа statsmodels тоже. Поэтому спорить с этими фактами и доказывать что-то друг другу бессмысленно.

В моем понимании, R для студентов и преподов и любителей. Чтобы можно было цитировать друг друга и хвастаться чем-нибудь. Для профессуры может какой-то, которая преподает.  Питон для серьезных проектов и продакшна. Не слышал ни о каком крупном МО проекте на R в продакшне.

Зачем Вы рассуждаете о том, как сами заявляете, не знаете?

Майкрософт приложила определенные усилия чтобы из R сделать инструмент для разработки крупных проектов большим числом разработчиков. 

Вот список продуктов/сервисов Microsoft, которые нам позволят работать с R:
  1. Microsoft R Server / R Server для Azure HDInsight
  2. Data Science VM
  3. Azure Machine Learning
  4. SQL Server R Services
  5. Power BI
  6. R Tools for Visual Studio

Каким любителям, какой профессуре необходима экосистема Microsoft R Server?



А виртуальные машины VM, позволяющие объединить все и вся?

А облачный сервис Azura с его пакетами машинного обучения и инструментами для коллективной разработки?


R на сегодня - промышленная система, интегрированная Майкрософт в свои и в не свои разработки. 


А Вы "для любителей"...

 
СанСаныч Фоменко #:

Зачем Вы рассуждаете о том, как сами заявляете, не знаете?

Майкрософт приложила определенные усилия чтобы из R сделать инструмент для разработки крупных проектов большим числом разработчиков. 

Вот список продуктов/сервисов Microsoft, которые нам позволят работать с R:
  1. Microsoft R Server / R Server для Azure HDInsight
  2. Data Science VM
  3. Azure Machine Learning
  4. SQL Server R Services
  5. Power BI
  6. R Tools for Visual Studio

Каким любителям, какой профессуре необходима экосистема Microsoft R Server?



А виртуальные машины VM, позволяющие объединить все и вся?

А облачный сервис Azura с его пакетами машинного обучения и инструментами для коллективной разработки?


R на сегодня - промышленная система, интегрированная Майкрософт в свои и в не свои разработки. 


А Вы "для любителей"...

понятно, что "там есть"

говорю исходя из опыта общения с внедренцами, в том числе крупными, по крайней мере в РФ

все делали на питоне

у микрософта и sdk есть по машинному обучению на C# и Asure, только никто ими не пользуется

вот вы сделали большой проект на R, положили на сервер. А кто его обслуживать будет? а никто, потому что нет спецов в таком количестве и никто не хочет учить R из-за одной статистики

а для питона любого студента за палку колбасы найми и все будет

"никто" - от слова НИКТО не пишет на R, ни под каким предлогом. Потому что есть питон.

а вы гоните трейдунов писать на R, чтобы они потом что? потратили время на бесполезный язык

 
mytarmailS #:

Тут еще вопрос что иметь ввиду под поиском максимума в зашумленной функции..

Как я понял определение  - "оптимизация зашумленной функции" это типа имееться в виду что просто функция сложной формы и в ней тяжело искать максимум, градиентные алгоритмы не применимы ну и выводы далее.. Те грубо говоря ниче страшного , применил алг. глобальной оптимизации и он пошел искать глобальный максимум...


А я вот смотрю по другому , я хочу найти максимум шумной функции но с удаленным шумом, те не глобальный максимум в шумной функции, а глобальный максимум в обезшумленой функции..

(это мой вопрос)  И это уже не тривиально, ведь функция то неизвесна, и параметры шума тоже..

Правильно там ответили что нужна априорная информация о шуме. Более того, нужно чёткая матмодель шума - аддитивная, мультипликативная или ещё какая-нибудь. Без модели фильтр не сделать. Ну и эта модель должна быть похожей на реальные данные.

Возможно, стоит посмотреть в сторону методов обработки геоданных, где работают с двух-трёхмерными данными. Ну или что-то вроде преобразования Фурье, как в картинках в jpg, или вейвлеты - как в новом варианте jpg, или многомерные сплайны и тд.

 
Maxim Dmitrievsky #:

я бы процитировал лозунг "бороться и искать - найти и перепрятать"

задавать как кастомную метрику любой критерий, в частности вот эти стандартные. Оптимизировать все равно по логлосс будет, но останавливаться будет по этим кастомным, что, наверное, имеет какой-то смысл

и действительно имеет, потому что останов в том же бустинге всегда по какому-то кастовому критерию типа accuracy 

Пока, наверно, только как-то так. Можно ещё обрезку деревьев делать по кастомному критерию.

 
Maxim Dmitrievsky #:

понятно, что "там есть"

говорю исходя из опыта общения с внедренцами, в том числе крупными, по крайней мере в РФ

все делали на питоне

у микрософта и sdk есть по машинному обучению на C# и Asure, только никто ими не пользуется

вот вы сделали большой проект на R, положили на сервер. А кто его обслуживать будет? а никто, потому что нет спецов в таком количестве и никто не хочет учить R из-за одной статистики

а для питона любого студента за палку колбасы найми и все будет

"никто" - от слова НИКТО не пишет на R, ни под каким предлогом. Потому что есть питон.

а вы гоните трейдунов писать на R, чтобы они потом что? потратили время на бесполезный язык

РФ плохой пример, ибо крайне дремуч в смысле матстата. Наш форум полон технарей, но представления о матстате у большинства крайне убогие. В институтах профессора учат матстату в екселе) Это всё крайне плохо характеризует нашу научно-техническую школу - серьёзные решения ещё со времён СССР гораздо чаще закупаются в готовом виде за границей, а не разрабатываются в стране.

 
Aleksey Nikolayev #:

Правильно там ответили что нужна априорная информация о шуме. Более того, нужно чёткая матмодель шума - аддитивная, мультипликативная или ещё какая-нибудь. Без модели фильтр не сделать. Ну и эта модель должна быть похожей на реальные данные.

Возможно, стоит посмотреть в сторону методов обработки геоданных, где работают с двух-трёхмерными данными. Ну или что-то вроде преобразования Фурье, как в картинках в jpg, или вейвлеты - как в новом варианте jpg, или многомерные сплайны и тд.

Да модель то я сделать могу без проблем, любое разложение, хоть РСА и вперед..

Но как с данными быть?, их же нет, это же неизвесная функция, да еще и многомерная..

ВСЕ Данные это раскиданные точки результатов поиска АО (это если их сохранять)

Это же не тайм серия, там ни структуры, ни порядка

Причина обращения: