Осмысленный семплинг по энтропии или корреляции - Общее обсуждение

Maxim Dmitrievsky 2022.09.27 08:33 #27561

JeeyCi #:
вот поэтому и говорю, что сначала с алгоритмом надо определяться (включая imbalance'ы - не знаю, что вы там с ними хотели сделать ?? - когда ранее советовали oversampling)... а потом искать либу, которая даёт возможности подрядить в код нужные сущности/классы... или кодить свою библиотеку со своими нужными вам классами

Ресемплинг делается чтобы удалить выбросы, гауссоизировать выборку

Я вообще предлагал осмысленный семплинг по энтропии или корреляции. Чтобы сделать фичи более информативными. Плюс взять приращения и добавить в них максимум информации из исходного ряда всяческими преобразованиями. Плюс нефиксированное запинающееся окно. Это фреш подход и такого никто не делал. Но подхватил какую-то коронавирусную херь и отдыхаю ☺️

Казуал инферннс должен было помочь выбрать информативные фичи, как вариант, но там оказалось не про это

Можно ли автоматизировать значение Интересное приветствие!? Как сделать? Абсолютные курсы

СанСаныч Фоменко 2022.09.27 08:33 #27562

JeeyCi #:
вот поэтому и говорю, что сначала с алгоритмом надо определяться (включая imbalance'ы - не знаю, что вы там с ними хотели сделать ?? - когда ранее советовали oversampling)... а потом искать либу, которая даёт возможности подрядить в код нужные сущности/классы... или кодить свою библиотеку со своими нужными вам классами

Все, что нужно, закодили до Вас.

Оболочка caret из R содержит до 200(!) моделей, в Вашей терминологии (библиотек) + вся необходимая обвязка для data mining и выбора моделей.

Проблема в подборе предикторов и их отборе, проблем в моделях давно нет.

Просьба и идея Bayesian regression - Делал Обсуждение статьи "Случайные леса

СанСаныч Фоменко 2022.09.27 08:38 #27563

Maxim Dmitrievsky #:
Ресемплинг делается чтобы удалить выбросы, сгладить выборку

Я вообще предлагал осмысленный семплинг по энтропии ищи корреляции. Чтобы сделать фичи более информативными. Плюс взять приращения и добавить в них максимум информации из исходного ряда всяческими преобразованиями. Плюс нефиксированное запинающееся окно. Это фреш подход и такого никто не делал. Но подхватил какую-то коронавирусную херь и отдыхаю ☺️

1. Ресемплинг выброса не удаляют. Есть программы, а можно по колхозному: меняем все, что больше +/- 0.005 из соответствующего квантиля на это значение. Статистика меняется удивительно.

2. Крайне интересно, особенно на энтропии. Хотелось бы увидеть результат. Корреляция - это для стационарных рядов, можно забыть.

Нужен математик или тот CopyClose почему ошибка? Как Вам новое оформление

Forester 2022.09.27 08:39 #27564

Maxim Dmitrievsky #: Плюс нефиксированное запинающееся окно.

Что за нефиксированное окно? Разное количество фич/столбцов в каждой строке? Но в модель то надо подавать всегда одинаковое количество столбцов.

Maxim Dmitrievsky 2022.09.27 08:41 #27565

СанСаныч Фоменко #:

1. Ресемплинг выброса не удаляют. Есть программы, а можно по колхозному: меняем все, что больше +/- 0.005 из соответствующего квантиля на это значение. Статистика меняется удивительно.

2. Крайне интересно, особенно на энтропии. Хотелось бы увидеть результат. Корреляция - это для стационарных рядов, можно забыть.

Ресемплинг через все, где есть гауссианы внутри - удаляет

Maxim Dmitrievsky 2022.09.27 08:42 #27566

elibrarius #:

Что за нефиксированное окно? Разное количество фич/столбцов в каждой строке? Но в модель то надо подавать всегда одинаковое количество столбцов.

А выше писал где-то недавно, если модеры не почистили

Forester 2022.09.27 08:48 #27567

Maxim Dmitrievsky #:
А выше писал где-то недавно, если модеры не почистили

Поиск на " нефиксированное окно" дает только эту страницу

СанСаныч Фоменко 2022.09.27 08:54 #27568

Maxim Dmitrievsky #:
Ресемплинг через все, где есть гауссианы внутри - удаляет

Любопытно, но очень мудрено.

Maxim Dmitrievsky 2022.09.27 08:54 #27569

elibrarius #:

Поиск на " нефиксированное окно" дает только эту страницу

Там где-то мысля была про фракталы и прочее, что последняя цена не всегда имеет лучшую предсказательную способность. То есть иногда надо останавливать окно по условиям или через другую нс зафитить, чтобы в прогнозе учавствовать предыдущие бары, а не последние. И так оно должно бегать туда-сюда по истории.

Советники: Pending Trailing 2 Любой вопрос новичка, чтоб Работа блока обработки ошибок

Maxim Dmitrievsky 2022.09.27 08:55 #27570

СанСаныч Фоменко #:

Любопытно, но очень мудрено.

Через гауссовские смеси попробуйте, у меня статья есть про это. Это генеративная модель. Работает на приращениях лучше автоэнкодера.

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2757