Настраивайте - признаки предикторы или искать модель. Посмотрите на обучение немного с другой стороны - Общее обсуждение

Aleksey Vyazmikin 2022.12.09 19:32 #28411

Кажется, что используются понятия с разным контекстом.

К примеру "плато" - это скорей широкий диапазон настроек способа получения внешних факторов, влияющих на логику модели. К примеру большой диапазон эффективности машек на базе которых сделан предиктор.

Оптимизация с помощью алгоритмов МО, обсуждаемая тут, занимается построением логики принятия решений, а оптимизация в тестере стратегий занимается, как правило, настройкой входных данных, а логика принятия решений уже прописана и в лучшем случае имеет вариативность.

Эти два вида оптимизации разные - одна меняет пространство, а другая взаимосвязи в нём.

Сейчас я задался вопросом, что в первую очередь нужно настраивать - признаки/предикторы или искать модель, а потом в оптимизаторе терминала искать оптимальные настройки. Хотя, искать настройки крайне сложно, если входных данных очень много.

Можно ли сразу при обучении менять пространство и логику, может стоит подумать, как это сделать?

СанСаныч Фоменко , стоит ли ожидать выборку?

Что подать на вход Есть ли закономерность в Базовые вопросы от новичка

СанСаныч Фоменко 2022.12.09 19:42 #28412

Andrey Dik #:

переобучение не следствие злоупотребления оптимизацией, а следствие неправильного выбора критерия оценки модели. ошибка сделана ещё ДО оптимизации. а вполне возможно что и на первом элементе цепочки - модель гомно.

говорить, что модель должна быть немного недоученной так же неверно, как хороший недообученный сапер или хирург. нужно винить либо сапера или хирурга, или их учителей, а не саму возможность учится (улучшаться, оптимизироваттся).

винить нестационарность так же не верно, приплетая сюда ещё и оптимизацию. это значит нет хорошей модели у исследоваиеля для нестационарнрго ряда.

Теперь понятно. У Вас поверхностное знакомство с моделями из машинного обучения.

Первый элемент цепочки - препроцессинг, который занимает от 50% до 70% трудозатрат. Здесь определяется будущий успех.

Второй элемент цепочки - обучение модели на наборе train.

Третий элемент цепочки - исполнение обученной модели на наборе test. Если результативность модели на этих наборах отличается хотя бы на треть, то модель переобучена. Получаешь такое через раз, если не чаще. Переобученная модель - это модель слишком точная модель. Извините, азы.

Обсуждение статьи "Нейросети бесплатно Библиотеки: BestInterval Обсуждение статьи "Случайные леса

СанСаныч Фоменко 2022.12.09 19:43 #28413

Aleksey Vyazmikin #:

СанСаныч Фоменко , стоит ли ожидать выборку?

О чем это?

Andrey Dik 2022.12.09 19:49 #28414

СанСаныч Фоменко #:

Теперь понятно. У Вас поверхностное знакомство с моделями из машинного обучения.

Первый элемент цепочки - препроцессинг, который занимает от 50% до 70% трудозатрат. Здесь определяется будущий успех.

Второй элемент цепочки - обучение модели на наборе train.

Третий элемент цепочки - исполнение обученной модели на наборе test. Если результативность модели на этих наборах отличается хотя бы на треть, то модель переобучена. Получаешь такое через раз, если не чаще. Переобученная модель - это модель слишком точная модель. Извините, азы.

как то у нас разные понятия об азах. извините. и говорим мы, похоже, на разных языках.

Aleksey Vyazmikin 2022.12.09 19:55 #28415

СанСаныч Фоменко #:

О чем это?

Ранее я писал

Форум по трейдингу, автоматическим торговым системам и тестированию торговых стратегий

Машинное обучение в трейдинге: теория, модели, практика и алготорговля

Aleksey Vyazmikin, 2022.12.08 08:44

Можете прислать свою выборку? У нас одинаковое виденье проблемы плохого обучения моделей, хочется сравнить на сколько Ваш метод отбора лучше моего, и вообще подходит ли под Вашу выборку.

Вы давали ответ, что идея хорошая, но стерли об этом сообщение.

Новая версия платформы MetaTrader Новая версия платформы MetaTrader Новая версия платформы MetaTrader

СанСаныч Фоменко 2022.12.09 19:59 #28416

Andrey Dik #:

как то у нас разные понятия об азах. извините. и говорим мы, похоже, на разных языках.

Насколько я теперь понял, я обсуждаю модели машинного обучения и оптимизацию, которая встроена в эти модели. Вы начали именно с этого, с нейросетей.

Вы же обсуждаете оптимизацию как таковую, что по мне не актуально в машинном обучении.

Успеха Вам в Ваших поисках глобального оптимума.

Тестер стратегий MetaTrader 5: Библиотеки: BestInterval Применяете ли вы нейросети

Andrey Dik 2022.12.09 21:03 #28417

СанСаныч Фоменко #:

Насколько я теперь понял, я обсуждаю модели машинного обучения и оптимизацию, которая встроена в эти модели. Вы начали именно с этого, с нейросетей.

Вы же обсуждаете оптимизацию как таковую, что по мне не актуально в машинном обучении.

Успеха Вам в Ваших поисках глобального оптимума.

смотря какого глобального оптимума. тот, который ищете вы и терпите не удачу, получая переобученные модели - мне не нужен))

посмотрите на обучение немного с другой стороны. вот построили вы модель, предикторы шмудикторы и дригие классные вещи, обучили модель, хлоп - на оос не работат. вот те на, опять АО виноват! так чтоли?

заявляю ответственно, не АО виноват, а модель плохая.

рекомендую тогда случайный ао с сортировкой. ваши модели всегда будут чуть чуть пьяненькими, чуть чуть недоученными. гарантированно.

Bayesian regression - Делал Есть ли закономерность в Обсуждение статьи "Случайные леса

Aleksey Nikolayev 2022.12.10 05:29 #28418

СанСаныч Фоменко #:

Дошел до самой важной мысли: несомненная связь между оптимизацией и переобучением модели. Модель всегда надо оставлять достаточно "грубой" и уж точно не нужны никакие глобальные оптимумы.

Простой отказ от глобального экстремума, очевидно, не даст возможности избежать переобучения (переподгонки, overfitting). Переобучение заключается в слишком большой приспособленности модели к данной конкретной выборке, в ущерб существующей закономерности. Происходит это вследствие крайне высокой гибкости практически всех алгоритмов МО. Поэтому стандартный способ борьбы с ней - введение штрафа за излишнюю гибкость модели в критерий оптимизации (регрессия лассо, как пример). Можно просто директивно ограничить гибкость модели, но по математической сути - это просто более жёсткий штраф.

Это, кстати, хороший пример того, почему должна быть возможность создания кастомных критериев.

Предпочтение глобальному экстремуму в пользу плато - это немного другое. Здесь уже речь не об излишней подгонке к конкретной выборке в ущерб существующей и неизменной зависимости. Здесь речь о том, что вследствие нестационарности цен (о чём вы и писали поначалу) зависимость меняется и нужно искать устойчивые (робастные) значения параметров, которые останутся достаточно хорошими и при небольших изменениях зависимости.

Не надо всё смешивать в одну кучу.

СанСаныч Фоменко #:

Когда я ищу приемлемый перечень предикторов - оптимизация в смысле штанов. Но смысл совершенно другой: попытка избежать "мусор на входе - мусор на выходе". Здесь качественное отличие от попыток поиска "правильного" алгоритмы, который находит глобальный оптимум. Никакой глобальный оптимум не даст прибыльную ТС на мусоре.

Выбор штанов - пример многокритериальной оптимизации - выбор происходит по длине, размеру, цвету, ткани, цене, бренду и тд) Понятно, что поверхность Парето не строится, а происходит неявное смешивание в голове покупателя всех критериев в один компромиссный. То же самое происходит и с выбором признаков. Важное отличие от штанов в том, что здесь будет полезной явная формализация компромиссного критерия оптимальности, поскольку постоянная опора на интуицию будет приводить к непредсказуемым сбоям.

Единый показатель качества стратегии Что подать на вход Принципы работы с оптимизатором

Andrey Dik 2022.12.10 07:16 #28419

если модель рабочая, то у неё существуют настройки, при которых она работает хорошо и на не известных данных. у неё так же скорее всего есть настройки не дающие удовлетворительной работы на oos - такой случай некоторые называют переобученностью. на самом деле не верно выбран критерий оценки. правильные критерии дадут фиолетовую кривую у рабочей модели. задача сводиться к максимизации (глобальный максимум) правильного оценочного критерия. другими словами, если найти глобальный максимум правильного критерия. то получим фиолетовую кривую.

и наоборот, если критерий выбран не правильно, то макимизация такого неправильного критерия даст красную кривую.

и это при условии, что модель рабочая, но видим, на сколько важен критерий оценки.

но если и модель не рабочая, то уже ничего не поможет, ни критерий ни оптимизация.

итак, модель->критерий->оптимизация критерия

Целевая функция в тестере Эконометрика: прогноз на один Эффективны ли торговые стратегии

Andrey Dik 2022.12.10 07:19 #28420

Aleksey Nikolayev #:

Выбор штанов - пример многокритериальной оптимизации - выбор происходит по длине, размеру, цвету, ткани, цене, бренду и тд) Понятно, что поверхность Парето не строится, а происходит неявное смешивание в голове покупателя всех критериев в один компромиссный. То же самое происходит и с выбором признаков. Важное отличие от штанов в том, что здесь будет полезной явная формализация компромиссного критерия оптимальности, поскольку постоянная опора на интуицию будет приводить к непредсказуемым сбоям.

выбор штанов хороший пример оптимизации по критерию. не всякие хорошие штаны подойдут каждому. оптимизация по пользовательскому критерию дает возможность получить самые лучшие, отлично сидящие штаны (глобальный максимум критерия).

штаны -> критерий оценки штанов -> выбор (оптимизация критерия оценки штанов)

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2842