Обсуждение статьи "Машинное обучение: как метод опорных векторов может быть использован в трейдинге"

 

Опубликована статья Машинное обучение: как метод опорных векторов может быть использован в трейдинге:

Метод опорных векторов уже достаточно давно применяется в таких областях науки, как биоинформатика и прикладная математика для анализа сложных наборов данных и выявления полезных паттернов, которые используются для классификации данных. Цель данной статьи - показать, что из себя представляет метод опорных векторов, как он работает, и почему он так полезен для выявления сложных паттернов.

Что такое "Метод опорных векторов"?

Метод опорных векторов - это метод машинного обучения, целью которого является попытка классифицировать входные наборы данных в один из двух классов. Для эффективной работы метода сначала необходимо использовать обучающую выборку, состоящую из входных и выходных данных, которая необходима для построения модели метода опорных векторов, и которую в дальнейшем можно будет использовать для классификации новых данных.

Для построения модели метода опорных векторов нужно взять обучающие входные данные, отобразить их в многомерное пространство, а затем использовать регрессию, чтобы найти гиперплоскость (гиперплоскость - это поверхность в n-мерном пространстве, которая разделяет его на два подпространства), которая лучше всего разделяла бы два класса входных данных. После обучения модели она способна классифицировать новые входные данные в один из классов при помощи разделяющей гиперплоскости.

По существу, метод опорных векторов является методом входов/выходов. Пользователь вводит входные данные, и на основе разработанной (при помощи обучения) модели получает выходные результаты. Теоретически, число входов для метода опорных векторов лежит в диапазоне от одного до бесконечности. Однако, в практическом применении, есть определенные ограничения на размер входной выборки, которые зависят от вычислительной мощности. Например, пусть для конкретного применения метода опорных векторов используются N входов (N - целое число, в диапазоне от 1 до бесконечности). Тогда задача метода опорных векторов заключается в том, чтобы сопоставить все входные данные размерности N и найти такую гиперплоскость размерности N-1, которая наилучшим образом разделяла бы обучающую выборку.

Метод входов/выходов


Автор: Josh Readhead

 
Вот я бы все таки отметил, что метод не бует работать, если хотя бы один из классов не связный, то есть состоит из 2 и более непересекающихся подгрупп. Например, если Шняки (на самом деле - компьютер перед анализом этого не знает!) бывают 2 видов - зеленоватые, весом 100 кг и которые любят морковку и радужно-блестящие весом 30 кг, которые морковку не переносят, но зато хавают селедку, то провести гиперплоскость между "шняками" и "не шняками" будет довольно проблематично. А такая ситуация на на рынке, да еще и в многомерном случае, типична вполне.
 

alsu:
 Вот я бы все таки отметил, что метод не бует работать, если хотя бы один из классов не связный, то есть состоит из 2 и более непересекающихся подгрупп. Например, если Шняки (на самом деле - компьютер перед анализом этого не знает!) бывают 2 видов - зеленоватые, весом 100 кг и которые любят морковку и радужно-блестящие весом 30 кг, которые морковку не переносят, но зато хавают селедку, то провести гиперплоскость между "шняками" и "не шняками" будет довольно проблематично. А такая ситуация на рынке, да еще и в многомерном случае, типична вполне. 

... И что для решения этой проблемы можно воспользоваться вот этим алгоритмом. Большое за него кстати спасибо!

 

P.S: Простите, но не удержался... :)

1) Вы видите существо с 9 ногами (!) и 4 глазами. Это не глюк!!! Это ШНЯК! 

2) Частота спаривания животных - 14000 Гц (14 000 раз за секунду). 0_o 

 
MigVRN:

... И что для решения этой проблемы можно воспользоваться вот этим алгоритмом. Большое за него кстати спасибо!

Перечитал - хорошо человек пишет, аж самому захотелось воспользоваться))
 
Интересная статья. Хорошо написана.
 
Проблема с 2-мя видами Шняков может решаться так: 1) указываются признаки, общие для обоих видов, но отличающие их от остальных животных. Результатом анализа будут оба вида без их разделения, но качество распознавания будет невысокое 2) дополнительно к пункту 1 указываются признаки, различающие 2 вида Шняков. В результате будет меньше ошибок, для которых эти признаки не выполняются, и больше ошибок с исполнением дополнительных признаков. Общий итог зависит от того, насколько дополнительные признаки отличают Шняков от всего остального. 3) возможно провести 2 анализа, в каждом выделяя конкретный вид Шняков. Предполагается высокая точность.
Причина обращения: