Обсуждение статьи "Нейросети — это просто (Часть 14): Кластеризация данных"

 

Опубликована статья Нейросети — это просто (Часть 14): Кластеризация данных:

Должен признаться, что с момента публикации последней статьи прошло уже больше года. За столь длительное время можно многое переосмыслить, выработать новые подходы. И в новой статье я хотел бы немного отойти от используемого ранее метода обучения с учителем, и предложить немного окунуться в алгоритмы обучения без учителя. И, в частности, рассмотреть один из алгоритмов кластеризации — k-средних.

Как видите, алгоритмы обучения без учителя позволяют решать различные задачи. Но каким образом мы сможем использовать их в своей торговле? Давайте подумаем. При использовании методов графического анализа мы практически всегда говорим о тех или иных графических паттернах: двойная вершина / двойное дно, голова-плечи, флаг, различные гармонические паттерны и т.д. Есть и более мелкие свечные паттерны, состоящие из 1-3 свечей. И, практически всегда, при попытке описания того или иного паттерна математическим языком мы сталкиваемся с большим количеством условностей и допусков. Что усложняет их использование в алготрейдинге. Надо сказать, что и при определении паттернов трейдером-человеком много субъективизма. Именно поэтому, анализируя один и тот же график различные трейдеры находят на нём различные паттерны, часто имеющие противоположную направленность прогнозного движения. Да, я согласен, на этом и построена вся система торговли. Кто-то получил прибыль, а кто-то убыток. В процессе торговли новые товарно-материальные ценности не создавались, и денежная масса осталась неизменной. Она лишь перекочевала из одного кошелька в другой. Но как нам не остаться в убытке?

Паттерн Голова-Плечи

Давайте посмотрим ещё раз на упомянутые выше графические паттерны. Да, все они имеют свои допуски. Но вместе с тем, каждый паттерн имеет свою определённую структуру, которая выделяет его из общего графика движения цены. А что, если мы воспользуемся алгоритмами кластеризации данных без учителя и поручим модели выделить все возможные вариации данных на некотором временном отрезке. Так как мы используем обучение без учителя, то нам не надо производить разметку данных и временной отрезок может быть довольно большим. Разумеется, мы должны помнить, что с увеличением временного отрезка истории растут и затраты на обучение модели.

Автор: Dmitriy Gizlyk