Обсуждение статьи "Квантование в машинном обучении (Часть 1): Теория, пример кода, разбор реализации в CatBoost"

 

Опубликована статья Квантование в машинном обучении (Часть 1): Теория, пример кода, разбор реализации в CatBoost:

В настоящей статье речь пойдёт о теоретическом применении квантования при построении древовидных моделей. Рассмотрены реализованные методы квантования в CatBoost. Материал будет подан без сложных математических формул, доступным языком.

Так что же такое квантование, и зачем его используют – давайте разбираться!

Вначале поговорим немного о данных. Итак, для создания моделей (проведения обучения) требуются данные, которые скрупулёзно собираются в таблицу, источником таких данных может быть любая информация, способная объяснить показание целевой (то - что будет определено моделью, к примеру, торговый сигнал). Источники данных называют по-разному – предикторы, фичи, признаки, факторы. Периодичность появления строки с данными определяется появлением сопоставимого наблюдения процесса явления, о котором собирается информация, и которой будет изучен с помощью машинного обучения. Совокупность полученных данных – называется выборкой.

Выборка может быть репрезентативной – это когда наблюдения, зафиксированные в ней, описывают весь процесс исследуемого явления, а может быть нерепрезентативной – это когда данных столько, сколько удалось собрать, что позволяет только частично описать процесс исследуемого явления. Как правило, мы, занимаясь финансовыми рынками, имеем именно дело с нерепрезентативными выборками в силу того, что ещё не происходило всего, что может произойти, и по этой причине неизвестно, как поведет себя финансовый инструмент при наступлении новых, ранее не происходящих, в своей совокупности, событий. Однако, всем известна мудрость "история повторяется", и именно на это наблюдение опирается алготрейдер при своих изысканиях, надеясь, что среди новых событий будут те, что были похожие на прежние, и исход их будет с выявленной вероятностью аналогичен.


Автор: Aleksey Vyazmikin

 

Опечатки:

3. Сохранение таблиц квантования в указанный файл – ключ "--input-borders-file"

4. Загрузка таблиц квантования из указанного файла – ключ "--output-borders-file"

Наоборот.

 
Квантование в машинном обучении - это не квантовая нейросеть (и не квантовое обучение нейросети).
 
Stanislav Korotky #:

Опечатки:

Наоборот.

Спасибо!

 
Sergey Pavlov #:
Квантование в машинном обучении - это не квантовая нейросеть (и не квантовое обучение нейросети).

Где это утверждается? Похоже, что слово "квантование" вводит в заблуждение и искажает ожидания?

 
Спасибо за статью, интересно!
 
Andrey Dik #:
Спасибо за статью, интересно!

Очень рад!

 
Очень интересная статья! Можно я добавлюсь к вам в друзья? Я новичок в ML. Пытаюсь кодить модели и сохранять их в ONNX, но получается сливная ерунда или же просто элементарное запоминание исторических данных(
 
Yevgeniy Koshtenko #:
Очень интересная статья!

Спасибо!

Yevgeniy Koshtenko #:
Можно я добавлюсь к вам в друзья? Я новичок в ML. Пытаюсь кодить модели и сохранять их в ONNX, но получается сливная ерунда или же просто элементарное запоминание исторических данных(

Добавил Вас, хотя мне могут писать все, кто хочет - нет ограничения программного.

Причина обращения: