Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3177

 
Aleksey Vyazmikin #:

Т.е. мне надо нагенерировать целевую бинарную для выборки, допустим и посмотреть, как часто будут находится квантовые отрезки по моей методики для разных предикторов, и так раз 10?

Если число квантовых отрезков будет найдено примерно столько же в среднем, как и сейчас на всех предикторах, то метод нерабочий, правильно понимаю ход мысли?

Ну да, смысл в многократном повторении вашей процедуры на большом числе заведомо бессмысленных  задач. Потом посмотреть как относительно них выглядит применение на конкретных реальных данных - если сильно не выделяется, то значит метод так себе. Обычно формализуют через подсчёт какого-то числа на каждом применении метода и набирают выборку, а потом смотрят попадает ли далеко в её хвост число посчитанное на реальных данных - если да то ок.

 
Maxim Dmitrievsky #:
Узрите, ибо если не дан вам паттерн в исконном ряду, то тропа Гильбертова не приведет вас к цели заветной. В бесовщину превратится ваш потуг, и заклание бесславное обрящете, вместо кущ райских.

Проблема сектантов в страхе перед проверкой своих религиозных догматов.

Паттернов всегда много - вопрос в правильном выборе.

 
Forester #:
А не достаточно ли было бы просто перемешать столбец с целевой?
Хвостатость и др. параметры ряда останутся те же. Мне кажется это - плюс.

Тоже неплохо. Наверно, лучше даже оба метода попробовать. Если в признаках много выбросов (тяжёлые хвосты), то результаты могут отличаться, что может дать дополнительную информацию.

 
Aleksey Vyazmikin #:

Проблема сектантов в страхе перед проверкой своих религиозных догматов.

Паттернов всегда много - вопрос в правильном выборе.

По крайней мере, я попытался.

 
Aleksey Vyazmikin #:

Можно подробней - я не понял.

Заведомо бессмысленную задачу можно получить просто перемешав метки случайным образом (или случайно сгенерировать их с вероятностями, равными частоте классов).

Идея всё та же - получить большую выборку из результатов большого числа заведомо бессмысленных задач для сравнения с результатом реальной задачи. Если реальный результат не находится в хвосте этой выборки, то метод, скорее, так себе.

 
Maxim Dmitrievsky #:

По крайней мере, я попытался.

Вы понимаете, для чего в CatBoost есть возможность использования разных методов квантования показателей предикторов?

Считаете, что просто программисты оставили такую возможность для тех, у кого мало оперативной памяти?

Или всё же разработчики понимают, что от этих таблиц напрямую зависит результат обучения?

А в конце то концов - возьмите сами и по перебирайти настройки таблицы и посмотрите на изменчивость результата.

Потом задумаетесь, почему так происходит, и, может, начнёте и меня лучше понимать.


А всякие высказывания в стиле проповедника\пророка\юродивого - не информативны. Трактуются мной, как желание покрасоваться своей персоной.

 
Aleksey Nikolayev #:

Заведомо бессмысленную задачу можно получить просто перемешав метки случайным образом (или случайно сгенерировать их с вероятностями, равными частоте классов).

Идея всё та же - получить большую выборку из результатов большого числа заведомо бессмысленных задач для сравнения с результатом реальной задачи. Если реальный результат не находится в хвосте этой выборки, то метод, скорее, так себе.

Возможно лучше "перемешивать", что бы сохранить пропорцию нулей и единиц.

 
Aleksey Vyazmikin #:

Вы понимаете, для чего в CatBoost есть возможность использования разных методов квантования показателей предикторов?

Считаете, что просто программисты оставили такую возможность для тех, у кого мало оперативной памяти?

Или всё же разработчики понимают, что от этих таблиц напрямую зависит результат обучения?

А в конце то концов - возьмите сами и по перебирайти настройки таблицы и посмотрите на изменчивость результата.

Потом задумаетесь, почему так происходит, и, может, начнёте и меня лучше понимать.


А всякие высказывания в стиле проповедника\пророка\юродивого - не информативны. Трактуются мной, как желание покрасоваться своей персоной.

Предлагается спросить разработчиков в их телеге, ибо неведомо мне что они творят 
 
Maxim Dmitrievsky #:
Предлагается спросить разработчиков в их телеге

Не стоит. Вдруг они ответят неправильно)

 
Aleksey Nikolayev #:

Не стоит. Вдруг они ответят неправильно)

😁😁
Причина обращения: