Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2848
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Что значит nx:1? Вы разве в вектор y получите не одно число после поиска логарифма? Не знаю синтаксис R.
Это вектор длины nx со значениями от nx до 1. Учите R, точите топор.
"Близкие" - как унифицировать степень близости? Мне же нужен алгоритм, а не ручная оценка в итоге.
Зависит от вашей задачи, сами решайте как. Мой вариант вряд ли вам подойдёт - использую отклонение от теоретического вида функции риска, подсчитанного для СБ.
Это вектор длины nx со значениями от nx до 1. Учите R, точите топор.
nx - это число элементов же. Как он может быть до 1, если больше 1?
В статье вообще делается акцент, что нужно знать распределение, прежде чем применять сам метод.nx - это число элементов же. Как он может быть до 1, если больше 1?
Убывает от nx до 1. Например 5:1 = (5,4,3,2,1), а 1:5 = (1,2,3,4,5)
В статье вообще делается акцент, что нужно знать распределение, прежде чем применять сам метод.
Как обычно в матстате - строится эмпирический аналог по выборке. Как среднее вместо матожидания, частота вместо вероятности или ECDF вместо CDF.
Грубо говоря, валить деревья не ленитесь, но ленитесь наточить топор.
Функция риска, простейший вариант на R
Участки кривой близкие к горизонтальной линии соответствуют провалам на гистограмме и здесь эти участки можно определить более точно, поскольку нет привязки к разбиению (как в гистограммах). Пользуюсь, например, при изучении распределения высот колен зигзага.
Извините за возможное не допонимание вопроса.
Или это из другой оперы?А функцию Хьюбера можно отнести к функции риска?
Она вроде похоже рассчитывается как вы показали на R.
Только как я понял там определяется 10%-ный перцентиль для выбросов.
Как то можно функцию потерь Хьюбера применить как функцию риска?
Убывает от nx до 1. Например 5:1 = (5,4,3,2,1), а 1:5 = (1,2,3,4,5)
Как обычно в матстате - строится эмпирический аналог по выборке. Как среднее вместо матожидания, частота вместо вероятности или ECDF вместо CDF.
Хорошо, вот построил, и что с этим делать?
И как тут гистограмму тогда приткнуть, если по x - число элементов в выборке?
И как тут гистограмму тогда приткнуть, если по x - число элементов в выборке?
По Х должна быть выборка (из высот столбцов, в вашем случае) отсортированная по возрастанию. И функция должна получиться возрастающая от ноля до log(nx). Если, например, nx=5, то у=( log(5/5), log(5/4), log(5/3), log(5/2), log(5/1)).
Или это из другой оперы?
Абсолютно из другой. У вас речь про один из вариантов функции потерь (loss function), а у нас про функцию риска (cumulative hazard function).
А обучение с подкрепление?
А чем подкреплять собираетесь?
Всё равно никакой не интеллект у Вас получится, а всего-лишь модель вегетативной нервной системы, да и то ...
Может рефлексы какие отрабатывать сумеете ...
А где он, интеллект? Где уровни абстракции? Где та же шизофрения?
ГДЕ всё это у Вашего искусственного интеллекта?
По Х должна быть выборка (из высот столбцов, в вашем случае) отсортированная по возрастанию. И функция должна получиться возрастающая от ноля до log(nx). Если, например, nx=5, то у=( log(5/5), log(5/4), log(5/3), log(5/2), log(5/1)).
Важное уточнение!
Тогда так?
А гистограмму как преобразовывать тогда?
Важное уточнение!
Тогда так?
А гистограмму как преобразовывать тогда?
Ну вот, горизонтальные участки уже видны. Хотя смущает наличие вертикальных. Ещё смущает, что максимум выборки у вас здесь 400, а раньше было около 60. Возможно, стоит вместо Х взять log(Х), предварительно выбросив нулевые значения из выборки - это позволит более детально увидеть район маленьких значений Х.
В любом случае, не знаю какая ваша задача в целом. Метод отвечает лишь на один конкретный ваш вопрос - как отделить самый высокий "забор" от самых низких "деревьев". Начало горизонтального участка (или близкого к горизонтальному по сравнению со средним наклоном остальных частей кривой) - это самый высокий забор, а конец такого участка - самое низкое дерево. На самом этом участке точек либо нет либо очень мало, что позволяет пренебречь ими.