Попробуйте разобраться, что может повлиять на внутреннюю структуру модели - Общее обсуждение

Maxim Dmitrievsky 2024.03.11 01:11 #34151

Полезное исследование :)

https://youtube.com/shorts/CkZe-HTgr4s?si=fwT5tLc6E-RLFkT6

Maxim Dmitrievsky 2024.03.11 01:34 #34152

mytarmailS #:

Нет, не правильно.. попробую еще раз обьяснить, забудь про модели пока вообще..

Есть у тебя много ТС оптимизированыйх на трейн и есть тест.

Создаем датасет для модели :

таргет = По тест мы смотрим работала ли ТС на тест (это целевая ДА/НЕТ)

дата = (признаки) это параметры ТС , кривая капитала, сделки, ФВ, шарп (если ТС на основе МО то кишки модельки)

Далее трейним уже как бы реальную модель отвечать будет работать конкретная ТС на тесте или нет

не вкупаю пока суть, если пример сделаешь - может дойдет )

или статью

Maxim Dmitrievsky 2024.03.11 02:17 #34153

Есть еще одна неочевидная вещь, которая может влиять на результаты обучения. Это, например, обучать классификатор не только прогнозировать метки бай/селл, но одновременно обучать его классифицировать котиков (грубый пример). То есть учить основной задаче и разным побочным задачам.

Это может как-то повлиять на внутреннюю структуру модели. Не видел таких исследований.

Нужен совет (нейросеть) "Новый нейронный" - проект Midjourney и другие нейросети

Aleksey Vyazmikin 2024.03.11 05:17 #34154

Forester #:

Вроде все просто - см комментарии на русском.

Спасибо, попробую разобраться.

Forester #:

А что такое среднее от всех? Это и есть центр кластера по этому столбцу.

Вероятно - разная терминология скорей всего.

Forester #:
Вот нашел в старом файле свой тест kmeans c ф-ей предикта:

Спасибо за код! Жаль, что он не компилируется.

Aleksey Vyazmikin 2024.03.11 05:22 #34155

mytarmailS #:
Откуда береться смещение?

Если примеров в листах не достаточно и модели будут лить то зачем вообще говорить пр эти листы.

Если нет смещения, то модель будет работать адекватно на новых данных.

Листья, попадающие под отбор содержат обычно 5% откликов от всей выборки, что при выборке в пару тысяч примеров мало для какого либо интервального анализа.

В прошлом году всем этим занимался.

Достаточность выборки нейронная сеть и входы Эконометрика: прогноз на один

Forester 2024.03.11 05:54 #34156

Aleksey Vyazmikin #:

Спасибо за код! Жаль, что он не компилируется.

Немного доработать придется. Например

dt.MatrixLearn

заменить на

MatrixLearn

У меня она была в классе dt. Может еще что-то где-то подправить. Но суть, думаю, ясна.

mytarmailS 2024.03.11 06:09 #34157

Maxim Dmitrievsky #:

Есть еще одна неочевидная вещь, которая может влиять на результаты обучения. Это, например, обучать классификатор не только прогнозировать метки бай/селл, но одновременно обучать его классифицировать котиков (грубый пример). То есть учить основной задаче и разным побочным задачам.

Это может как-то повлиять на внутреннюю структуру модели. Не видел таких исследований.

Не уверен работает ли такое жля деревянных моделей

Aleksey Vyazmikin 2024.03.11 06:21 #34158

Forester #:

Немного доработать придется. Например

заменить на У меня она была в классе dt. Может еще что-то где-то подправить. Но суть, думаю, ясна.

Да, главное, что есть функция для предсказания, как я понимаю - она самописная и в класс изначально не входила.

Жаль, что в стандартной функции кластеризации не предусмотрели seed для рандомизатора, что полезно для отладки.

Forester 2024.03.11 07:00 #34159

Aleksey Vyazmikin #:

Да, главное, что есть функция для предсказания, как я понимаю - она самописная и в класс изначально не входила.

Жаль, что в стандартной функции кластеризации не предусмотрели seed для рандомизатора, что полезно для отладки.

Самописная. Но там есть проверочный код - результаты отнесения к кластерам из нее и из KMeansGenerate на обучающей матрице полностью совпадали, когда я проверял.

Каждый Restarts - с разными стартовыми точками начинает. Рандомизация есть, но (наверное) не повторяемая - не проверял. Думаю, это можно доработать, если очень надо...

Канальная торговая система Требуется совета насчет фриланса Помогите оптимизировать код советника,

Forester 2024.03.11 07:05 #34160

Maxim Dmitrievsky #:

Есть еще одна неочевидная вещь, которая может влиять на результаты обучения. Это, например, обучать классификатор не только прогнозировать метки бай/селл, но одновременно обучать его классифицировать котиков (грубый пример). То есть учить основной задаче и разным побочным задачам.

Это может как-то повлиять на внутреннюю структуру модели. Не видел таких исследований.

Обычный мультикласс. Не 2-м классам обучение, а например 5-ти. Модель просто отдаст часть ответов/листьев другим классам и будет реже предсказывать основные. Мне кажется лучше несколько однозадачных моделей.

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3416