Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2848

 
Aleksey Vyazmikin #:

Что значит nx:1? Вы разве в вектор y получите не одно число после поиска логарифма? Не знаю синтаксис R.

Это вектор длины nx со значениями от nx до 1. Учите R, точите топор.

Aleksey Vyazmikin #:

"Близкие" - как унифицировать степень близости? Мне же нужен алгоритм, а не ручная оценка в итоге.

Зависит от вашей задачи, сами решайте как. Мой вариант вряд ли вам подойдёт - использую отклонение от теоретического вида функции риска, подсчитанного для СБ.

 
Aleksey Nikolayev #:

Это вектор длины nx со значениями от nx до 1. Учите R, точите топор.

nx - это число элементов же. Как он может быть до 1, если больше 1?

В статье вообще делается акцент, что нужно знать распределение, прежде чем применять сам метод.
 
Aleksey Vyazmikin #:

nx - это число элементов же. Как он может быть до 1, если больше 1?

Убывает от nx до 1. Например 5:1 = (5,4,3,2,1), а 1:5 = (1,2,3,4,5)

Aleksey Vyazmikin #:

В статье вообще делается акцент, что нужно знать распределение, прежде чем применять сам метод.

Как обычно в матстате - строится эмпирический аналог по выборке. Как среднее вместо матожидания, частота вместо вероятности или ECDF вместо CDF.

 
Aleksey Nikolayev #:

Грубо говоря, валить деревья не ленитесь, но ленитесь наточить топор.

Функция риска, простейший вариант на R

Участки кривой близкие к горизонтальной линии соответствуют провалам на гистограмме и здесь эти участки можно определить более точно, поскольку нет привязки к разбиению (как в гистограммах). Пользуюсь, например, при изучении распределения высот колен зигзага.

Извините за возможное не допонимание вопроса.
А функцию Хьюбера можно отнести к функции риска?
Она вроде похоже рассчитывается как вы показали на R.
Только как я понял там определяется 10%-ный перцентиль для выбросов.
Как то можно функцию потерь Хьюбера применить как функцию риска?

Или это из другой оперы?
 
Aleksey Nikolayev #:

Убывает от nx до 1. Например 5:1 = (5,4,3,2,1), а 1:5 = (1,2,3,4,5)

Как обычно в матстате - строится эмпирический аналог по выборке. Как среднее вместо матожидания, частота вместо вероятности или ECDF вместо CDF.

Хорошо, вот построил, и что с этим делать?

И как тут гистограмму тогда приткнуть, если по x - число элементов в выборке?

Файлы:
 
Aleksey Vyazmikin #:

И как тут гистограмму тогда приткнуть, если по x - число элементов в выборке?

По Х должна быть выборка (из высот столбцов, в вашем случае) отсортированная по возрастанию. И функция должна получиться возрастающая от ноля до log(nx). Если, например, nx=5, то у=( log(5/5), log(5/4), log(5/3), log(5/2), log(5/1)).


 
Roman #:

Или это из другой оперы?

Абсолютно из другой. У вас речь про один из вариантов функции потерь (loss function), а у нас про функцию риска (cumulative hazard function).

 
mytarmailS #:
А обучение с подкрепление? 

А чем подкреплять собираетесь? 

Всё равно никакой не интеллект у Вас получится, а всего-лишь модель вегетативной нервной системы, да и то ... 

Может рефлексы какие отрабатывать сумеете ... 

А где он, интеллект? Где уровни абстракции? Где та же шизофрения? 

ГДЕ всё это у Вашего искусственного интеллекта? 

 
Aleksey Nikolayev #:

По Х должна быть выборка (из высот столбцов, в вашем случае) отсортированная по возрастанию. И функция должна получиться возрастающая от ноля до log(nx). Если, например, nx=5, то у=( log(5/5), log(5/4), log(5/3), log(5/2), log(5/1)).


Важное уточнение!

Тогда так?

А гистограмму как преобразовывать тогда?

Файлы:
 
Aleksey Vyazmikin #:

Важное уточнение!

Тогда так?

А гистограмму как преобразовывать тогда?

Ну вот, горизонтальные участки уже видны. Хотя смущает наличие вертикальных.  Ещё смущает, что максимум выборки у вас здесь 400, а раньше было около 60. Возможно, стоит вместо Х взять log(Х), предварительно выбросив нулевые значения из выборки - это позволит более детально увидеть район маленьких значений Х.

В любом случае, не знаю какая ваша задача в целом. Метод отвечает лишь на один конкретный ваш вопрос - как отделить самый высокий "забор" от самых низких "деревьев". Начало горизонтального участка (или близкого к горизонтальному по сравнению со средним наклоном остальных частей кривой) - это самый высокий забор, а конец такого участка - самое низкое дерево. На самом этом участке точек либо нет либо очень мало, что позволяет пренебречь ими.

Причина обращения: