Не устал бредить несколько лет подряд. Пришло время прятаться за юбкой. Иди почитай что такое НС и как ее обучать, дурко - Общее обсуждение

Forester 2022.10.24 08:16 #27971

Maxim Dmitrievsky #:

предварительный отбор признаков для современных моделей типа Бустинг почти ничего не дает.

Бустинг ищет самые лучшие сплиты из всех столбцов и всех примеров. Т.е. использует самые лучшие фичи.
Случ. лес берет половину фич и половину примеров (доля настраиваема) для каждого дерева и потом из 20-100 деревьев находит среднее. Если из 200 фич всего 5 информативных, то в часть деревьев информатывные фичи и не попадут (в среднем по 2.5 инф. фичи на дерево). И усреднять будем часть информативных деревьев с шумовыми деревьями. Результат будет тоже очень зашумленным.
Случ. лес хорошо сработает, если информативных фич много (как в классических примерах/задачах МО).

Бустинг найдет и будет использовать самые информативные фичи, т.к. он проверяет их все. Так что по логике работы бустинга, он сам отберет наилучшие фичи. Но у буста свои проблемы тоже есть.

Есть ли закономерность в Что подать на вход Обсуждение статьи "Random Decision

Aleksey Vyazmikin 2022.10.24 08:23 #27972

elibrarius #:

Бустинг найдет и будет использовать самые информативные фичи, т.к. он проверяет их все. Так что по логике работы бустинга, он сам отберет наилучшие фичи. Но у буста свои проблемы тоже есть.

Создал тему с выборкой, которая доказывает обратное - бустинг не всесилен, особенно из коробки.

СанСаныч Фоменко 2022.10.24 08:26 #27973

elibrarius #:

Бустинг ищет самые лучшие сплиты из всех столбцов и всех примеров. Т.е. использует самые лучшие фичи.
Случ. лес берет половину фич и половину примеров (доля настраиваема) для каждого дерева и потом из 20-100 деревьев находит среднее. Если из 200 фич всего 5 информативных, то в часть деревьев информатывные фичи и не попадут (в среднем по 2.5 инф. фичи на дерево). И усреднять будем часть информативных деревьев с шумовыми деревьями. Результат будет тоже очень зашумленным.
Случ. лес хорошо сработает, если информативных фич много (как в классических примерах/задачах МО).

Бустинг найдет и будет использовать самые информативные фичи, т.к. он проверяет их все. Так что по логике работы бустинга, он сам отберет наилучшие фичи. Но у буста свои проблемы тоже есть.

Не могу согласиться по бустингу.

Бустинг найдет признаки, имеющими сильную связь (предсказательную способность) - верим в это. Все прекрасно, если величина связи является постоянной. Отказавшись от оценки самого признака, в бустинге мы не можем отследить изменчивость величины связи, а по моим данных SD оценки связи может меняться от 10% до 120 (на моих признаках). Что нам даст бустинг? Ведь надо обраковать признаки, которые имеют большую изменчивость.

Алгоритм объединения диапазонов отрезка Эконометрика: прогноз на один [Архив!] FOREX - Тенденции,

Maxim Dmitrievsky 2022.10.24 08:41 #27974

СанСаныч Фоменко #:

Сама оценка штука относительная.

Повторю картинки.

Плохо, безнадежно%

Получше, если таких несколько, можно будет говорить о 30% ошибки предсказания.

И мусор обязательно удалять, а то на наборе обучения фишка может лечь в пользу мусора, легче найти значение, которое ведет к оптимуму.

чем больше взаимной инфы при разделении на классы, тем распределения меньше пересекаются, что логично

Распределения все равно уплывут на новых данных.

Я бы не надеялся на всякие такие манипуляции сильно, просто идейку попробовать.

FOREX - Тенденции, прогнозы Графический анализ множества показателей switch или if

Maxim Dmitrievsky 2022.10.24 08:43 #27975

elibrarius #:

Бустинг ищет самые лучшие сплиты из всех столбцов и всех примеров. Т.е. использует самые лучшие фичи.
Случ. лес берет половину фич и половину примеров (доля настраиваема) для каждого дерева и потом из 20-100 деревьев находит среднее. Если из 200 фич всего 5 информативных, то в часть деревьев информатывные фичи и не попадут (в среднем по 2.5 инф. фичи на дерево). И усреднять будем часть информативных деревьев с шумовыми деревьями. Результат будет тоже очень зашумленным.
Случ. лес хорошо сработает, если информативных фич много (как в классических примерах/задачах МО).

Бустинг найдет и будет использовать самые информативные фичи, т.к. он проверяет их все. Так что по логике работы бустинга, он сам отберет наилучшие фичи. Но у буста свои проблемы тоже есть.

Логично

СанСаныч Фоменко 2022.10.24 08:59 #27976

Maxim Dmitrievsky #:
чем больше взаимной инфы при разделении на классы, тем распределения меньше пересекаются, что логично

Распределения все равно уплывут на новых данных.

Я бы не надеялся на всякие такие манипуляции сильно, просто идейку попробовать.

Вы не обратили внимание на изменчивость sd

Forester 2022.10.24 09:15 #27977

СанСаныч Фоменко #:

Не могу согласиться по бустингу.

Бустинг найдет признаки, имеющими сильную связь (предсказательную способность) - верим в это. Все прекрасно, если величина связи является постоянной. Отказавшись от оценки самого признака, в бустинге мы не можем отследить изменчивость величины связи, а по моим данных SD оценки связи может меняться от 10% до 120 (на моих признаках). Что нам даст бустинг? Ведь надо обраковать признаки, которые имеют большую изменчивость.

Все модели МО ищут закономерности. Бустинг автоматически выбирает лучшие признаки на трейне.

Если есть изменчивость (например в рыночных данных), то надо как то дополнительно выкручиваться. Я экспериментировал с валкинг форвардом. Но он просто показывает результат, на отбор признаков он не влияет. Да и ничто вам не предскажет, какие признаки будут работать в будущем, если нет закономерностей или они меняются. Единственный шанс, что меняются не моментально, а модель какое-то время еще поработает.

Есть ли закономерность в Лига Торговых Систем. Продолжаем Предсказание рынка на основе

Forester 2022.10.24 09:17 #27978

Aleksey Vyazmikin #:

Создал тему с выборкой, которая доказывает обратное - бустинг не всесилен, особенно из коробки.

Думаю это не проблема буста, а изменчивости данных. Попробую обучиться на ваших данных.

Aleksey Vyazmikin 2022.10.24 09:30 #27979

elibrarius #:
Думаю это не проблема буста, а изменчивости данных. Попробую обучиться на ваших данных.

Конечно, дело не в алгоритме, как таковом, а в данных.

Попробуйте, может, что у Вас выйдет!

Выборка относительно уникальна тем, что на ней тяжело обучиться, что б что то работала за пределами обучения.

Я пока с ней так же экспериментирую.

Нужна Помощь GetLotLastClosePos() Советники: ZigZaHod

Forester 2022.10.24 10:07 #27980

Aleksey Vyazmikin #:

Выборка относительно уникальна тем, что на ней тяжело обучиться, что б что то работала за пределами обучения.

Разве это уникальность? За пределами обучения рыночные данные обычно не работают. Я вам там задал пару вопросов

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2798