Обсуждение статьи "Возможности Мастера MQL5, которые вам нужно знать (Часть 09): Сочетание кластеризации k-средних с фрактальными волнами"

 

Опубликована статья Возможности Мастера MQL5, которые вам нужно знать (Часть 09): Сочетание кластеризации k-средних с фрактальными волнами:

Кластеризация k-средних использует подход к группировке точек данных в виде процесса, изначально фокусирующегося на макропредставлении набора данных, в котором применяются случайно сгенерированные центроиды кластера. Затем эти центроиды масштабируются и настраиваются для точного представления набора данных. В статье рассматриваются кластеризация и несколько вариантов ее использования.

По умолчанию метод k-средних очень медленный и неэффективный, поэтому его часто называют "наивным" в том смысле, что существуют более быстрые реализации. Частично это связано со случайным назначением начальных центроидов набору данных в начале оптимизации. Кроме того, после того, как были выбраны случайные центроиды, часот используется алгоритм Ллойда для получения правильного центроида и, следовательно, значений категории. Существуют дополнения и альтернативы алгоритму Ллойда, в том числе:естественные перерывы Дженкса (Jenks’ Natural Breaks), которые фокусируются на среднем значении кластера, а не на расстоянии до выбранных центроидов; k-медианы, которые, как следует из названия, используют медиану кластера, а не центроид или среднее значение, в качестве посредника для достижения идеальной классификации; k-медоиды, которые используют фактические точки данных внутри каждого кластера в качестве потенциального центроида, что делает его более устойчивым к шуму и выбросам, согласно Википедии; и наконец кластеризация в нечетком режиме, при которой границы кластера нечеткие, а точки данных имеют тенденцию принадлежать более чем одному кластеру. Этот последний формат интересен тем, что вместо "классификации" каждой точки данных, используется регрессивный вес, который количественно определяет, насколько данная точка данных принадлежит каждому из применимых кластеров.

bannr

Наша цель в этой статье - продемонстрировать еще один тип реализации k-средних, который преподносится как более эффективный, а именно:k-means++. Этот алгоритм опирается на методы Ллойда, такие как наивные k-средние по умолчанию, но отличается первоначальным подходом к выбору случайных центроидов. Этот подход не такой "случайный", как наивные k-средние, и из-за этого он имеет тенденцию сходиться гораздо быстрее и эффективнее.

Автор: Stephen Njuki

Причина обращения: