Хорошая статья - Статьи и техническая библиотека по автоматическому трейдингу

Stanislav Korotky 2020.11.05 12:52 #11

Maxim Dmitrievsky:

Лучше у разрабов спрашивать

Не люблю видео, потому что чтобы получить ответ на конкретный вопрос нужно кучу лабуды выслушать, и не факт, что ответ действительно найдется. Разумеется, я читал текстовую вводную документацию разрабов, но именно этот нюанс по выбору разбивки на основании гистограммы они элегантно "перепрыгнули", хотя всё остальное довольно досконально.

Всё таки робот намного MqlDateTime и Array out Обсуждение документации MQL4

Boris Egorov 2020.11.05 12:54 #12

Хорошая статья .... безусловно

Stanislav Korotky 2020.11.05 12:57 #13

Aleksey Vyazmikin:

Деревья строятся независимо друг от друга, а потом происходит подсчет в листьях (перебор по отквантованным предикторам) таким образом, что бы уменьшалась ошибка по градиенту.

При выборе предикторов для построения дерева и сплитов дерева используются рандомные коэффициенты, что дает возможность, в теории, увеличивать полноту (Recall) и препятствовать переобучению.

Это всё никоим образом не отвечает на вопрос.

Например, есть страница - https://catboost.ai/news/catboost-enables-fast-gradient-boosting-on-decision-trees-using-gpus

На ней фраза:

The search for the best split now is just a computation of histograms, shown in figure 6.

Вот тут и возникает вопрос: расчет гистограммы понятен, но как после него перейти к "best split"? В любых терминах: общими словами, псевдокодом, формулой.

CatBoost Enables Fast Gradient Boosting on Decision Trees Using GPUs

catboost.ai

Machine Learning techniques are widely used today for many different tasks. Different types of data require different methods. Yandex relies on Gradient Boosting to power many of our market-leading products and services including search, music streaming, ride-hailing, self-driving cars, weather prediction, machine translation, and our...

Будете ли вы пользоваться Асинхронное и многопоточное программирование Задачка: Что такое ДЁШЕВО

Denis Kirichenko 2020.11.05 13:06 #14

Ничего против других авторов статьей по МО не имею, но, имхо, у автора данной статьи материал представлен как в хорошем учебнике, который и нужно читать, и есть желание прочитать... Респект и уважуха.

Forester 2020.11.05 13:35 #15

Stanislav Korotky:

Это всё никоим образом не отвечает на вопрос.

Например, есть страница - https://catboost.ai/news/catboost-enables-fast-gradient-boosting-on-decision-trees-using-gpus

На ней фраза:

Вот тут и возникает вопрос: расчет гистограммы понятен, но как после него перейти к "best split"? В любых терминах: общими словами, псевдокодом, формулой.

Разделив данные по столбцу, вычисляется насколько блок справа и слева стали чище от примесей другого класса.

Из всех разделений по всем столбцам выбирается тот вариант, который дает лучшую чистоту. (Иногда называют как уменьшение нечистоты.)

Формулы чистоты/нечстоты есть разные, есть которая сразу в обоих блоках улучшает чистоту, есть которая ищет 1 блок максимально чистый.

Самое чистое разделение, это когда слева остались только примеры одного класса, а справа другого.

Машинное обучение в трейдинге: Машинное обучение и нейронные Учебники по программированию

Rorschach 2020.11.05 14:07 #16

Чем случайный семплинг лучше константы?

Maxim Dmitrievsky 2020.11.05 17:04 #17

Rorschach:
Чем случайный семплинг лучше константы?

Можно получать разное кол-во сделок, разные их комбинации во времени

изначально делал для брутфорса

Rorschach 2020.11.05 18:18 #18

Прикольно, думал раз такое низкое матожидание, то тестерный грааль. Прогнал по Саберу, на кастомном символе, почти такой же результат.

Проверил 17 год, там похожий аптренд, сливает.

Это такой удачный кусок истории попался или за прошлые года тоже можно получить такую картинку? Знаю, на тесте сливает, но там совсем другой рынок был.

СОВЕТНИК - ЗАДОМ НА [ВНИМАНИЕ, ТЕМА ЗАКРЫТА!] Любой Существует ли на этом

Aleksey Vyazmikin 2020.11.05 23:00 #19

Stanislav Korotky:

Вот тут и возникает вопрос: расчет гистограммы понятен, но как после него перейти к "best split"? В любых терминах: общими словами, псевдокодом, формулой.

Предположу, что у нас по каждому сплиту расчет, а дальше идет суммирование диапазонов, и получается матрица из которой выбирается наибольшее значение - точности разбиения.

Вообще, у них код открытый, если хорошо понимаете C++, то сможете всем интересующимся рассказать детали!

Машинное обучение в трейдинге: Есть ли кто-нибудь из Выбрать последние 2 ордера

Aleksey Vyazmikin 2020.11.05 23:03 #20

Максим,спасибо за статью!

Дает ли эффект кроссвалидация?

Непробывал ли взять разных ретурнов от сотни разнопериодных машек?

Обсуждение статьи "Градиентный бустинг (CatBoost) в задачах построения торговых систем. Наивный подход" - страница 2