Для оценки эффективности модели требуется метрика какая то, не просто стат показатель точности классификации. По идее, этот рандом не так страшен, как - Общее обсуждение

Aleksey Vyazmikin 2023.11.11 17:51 #33341

Forester #:

Бинарный признак с 0и1 уже нормирован, а остальные нужно тоже нормировать.

Понял ход Вашей мысли, надеюсь.

Но, при равномерном квантовании на те же 32 отрезка, можно же считать, что отрезок "1" - 0, а отрезок "32" - 1. Так и с другими любыми цифрами. Поэтому и не пойму, в чём тут принципальная разница.

Любой вопрос новичка, чтоб DRAW_COLOR_ZIGZAG в пределах одного ОПТИМИЗАЦИЯ как основа торговой

Forester 2023.11.11 20:07 #33342

Aleksey Vyazmikin #:

Понял ход Вашей мысли, надеюсь.

Но, при равномерном квантовании на те же 32 отрезка, можно же считать, что отрезок "1" - 0, а отрезок "32" - 1. Так и с другими любыми цифрами. Поэтому и не пойму, в чём тут принципальная разница.

Если к 32 сводите, то растягивайте и бинарный 0 и 1 до 0 и 32 (и другие, например с 5 квантами от 0...5 до 0...32). Чтобы все соразмерно было. Ну или сжимайте классически все к единичному гиперкубу (как для нейросетей, которым нормировка обязательна.) Суть та же - в обоих вариантах получим один масштаб.

Вертикальный масштаб в пунктах Все варианты логического массива. Напишу индикатор бесплатно

Maxim Dmitrievsky 2023.11.11 22:16 #33343

СанСаныч Фоменко #:

Метки (учитель, целевая переменная) НЕ могут быть мусорными по определению.

Саныч, не позорься

ты даже еще не начинал изучать, чтобы выражать свое мнение

Aleksey Vyazmikin 2023.11.12 05:01 #33344

Ещё забавный факт, я тут подумал, видимо это как раз и есть переобучение, и решил посмотреть на каких индексах произошло изменение класса - думал, что ближе к концу и это как раз хорошая иллюстрация переобучения.

По факту оказалось так

На выборке test

Получается, что это первая тысяча листов (в очередной последовательности добавления в модель) в большей мере не стабильна!

Удивлён.

На выборке exam

Прогнозирование цены с использованием HFT, Арбитраж Есть ли закономерность в

Forester 2023.11.12 08:27 #33345

Aleksey Vyazmikin #:

Ещё забавный факт, я тут подумал, видимо это как раз и есть переобучение, и решил посмотреть на каких индексах произошло изменение класса - думал, что ближе к концу и это как раз хорошая иллюстрация переобучения.

По факту оказалось так

На выборке test

Получается, что это первая тысяча листов (в очередной последовательности добавления в модель) в большей мере не стабильна!

Удивлён.

На выборке exam

Вы же бустнгом считаете? Там только первое дерево обучается по меткам исходного учителя.
Для всех остальных деревьев, учителем является ошибка предсказания, т.е. (Y - Pred). Да еще и с коэффициентом eta = 0.1...0.001. Влияние листьев этих деревьев - незначительно, они лишь корректируют. Что вы и показали (их незначительность).

Пожелания к синтаксису языка Робот на нейронный сетях Есть ли закономерность в

Yuriy Vasilyev 2023.11.12 08:52 #33346

GPT научить )

Хорошо, добавим индикатор Envelopes (оболочки) в наш анализ. Индикатор Envelopes представляет собой линии, расположенные выше и ниже скользящего среднего. Обычно они находятся на фиксированном процентном расстоянии от этого скользящего среднего.

Envelopes для последнего месяца (ноябрь 2023):
- Выберем процентное расстояние от скользящего среднего.
- Рассчитаем верхнюю и нижнюю линии Envelopes.
Общий тренд с использованием RSI, Bollinger Bands и Envelopes:
- Сравним сигналы, полученные от разных индикаторов.

Также, учтем, что сигналы от различных индикаторов могут быть конфликтными, и важно анализировать их вместе.

Давайте продолжим с расчетами и анализом.

Кое-что интересное в финансовом Вопросы от начинающих MQL5 Кое-что интересное в финансовом

Maxim Dmitrievsky 2023.11.12 09:41 #33347

Yuriy Vasilyev #:

GPT научить )

Хорошо, добавим индикатор Envelopes (оболочки) в наш анализ. Индикатор Envelopes представляет собой линии, расположенные выше и ниже скользящего среднего. Обычно они находятся на фиксированном процентном расстоянии от этого скользящего среднего.

Envelopes для последнего месяца (ноябрь 2023):
- Выберем процентное расстояние от скользящего среднего.
- Рассчитаем верхнюю и нижнюю линии Envelopes.
Общий тренд с использованием RSI, Bollinger Bands и Envelopes:
- Сравним сигналы, полученные от разных индикаторов.

Также, учтем, что сигналы от различных индикаторов могут быть конфликтными, и важно анализировать их вместе.

Давайте продолжим с расчетами и анализом.

А цены пробовал подать, чтобы прогноз получить? В маркете подобное вроде как практикуется, кто-то слил алгоритм, видимо

Aleksey Vyazmikin 2023.11.12 11:50 #33348

Forester #:
Вы же бустнгом считаете?

Вы совершенно правы, речь идёт о CatBoost!

Forester #:
Там только первое дерево обучается по меткам исходного учителя.
Для всех остальных деревьев, учителем является ошибка предсказания, т.е. (Y - Pred).

Действительно, так следует из теории.

Forester #:
Да еще и с коэффициентом eta = 0.1...0.001

Коэффициент "скорости обучения", во всяком случае в CatBoost, фиксируется для всех деревьев.

Forester #:
Влияние листьев этих деревьев - незначительно, они лишь корректируют. Что вы и показали (их незначительность).

Вы действительно можете объяснить, как расставляются коэффициенты листьям в CatBoost?

Есть моменты, которые я плохо понимаю.

Однако, я продемонстрировал изменение "класса" в листьях, т.е. фактически 40% листьев оказалось тянут общий итог не в ту сторону на новых данных.

Группировка листьев - требуются Нулевая корреляция выборки вовсе Есть ли закономерность в

Forester 2023.11.12 12:42 #33349

Aleksey Vyazmikin #:

Вы действительно можете объяснить, как расставляются коэффициенты листьям в CatBoost?

Хотите, чтобы я вам перекопал код катбуста и дал точный ответ? Я копаю только то, что мне интересно. Катбустом не пользуюсь.
Про коэффициенты листьям впервые слышу - что это?

Учебный и простой код буста тут https://habr.com/ru/companies/vk/articles/438562/

Пишем XGBoost с нуля — часть 2: градиентный бустинг

2019.02.07
habr.com

Всем привет! В прошлой статье мы разбирались, как устроены решающие деревья, и с нуля реализовали алгоритм построения, попутно оптимизируя и улучшая его. В этой статье мы реализуем алгоритм градиентного бустинга и в конце создадим свой собственный XGBoost. Повествование будет идти по той же схеме: пишем алгоритм, описываем его, в заверешение...

mytarmailS 2023.11.12 14:00 #33350

Aleksey Vyazmikin #:

Сообщаю, что на отдельной выборке test - 7467, а на exam - 7177, но там есть не малое число листьев без активаций вообще - сразу не посчитал.

Так выглядит распределение сменивших класс листьев по их значению для выборки test

а это exam.

А это разбивка на классы - их три, третий "-1" - отсутствие активации.

Для выборки train

Для выборки test

Для выборки exam

В общем видно, что веса листьев больше не соответствуют логике класса - ниже график с выборки test - уже нет чёткого вектора.

В общем, аппроксимирует данный способ обучения что угодно, но вот за качество предикторов он не ручается.

Вообще, допускаю, что отчётливые "столбики" на графике выше - весьма схожие листья по месту и частоте активации.

Сложно обсуждать то, о чём не знаешь. Поэтому, могу только порадоваться за Ваши успехи. Если бы у меня был такой метод, то я бы использовал его :)

Мой метод, пока, не даёт таких качественных результатов, но он достаточно хорошо паралеллиться.

А вы не задумывались почему так происходит?

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3335