Плотность числового ряда - страница 24

 
Ну, опять же, почему не подходит тот метод, который я показал под названием v2?   При какой дельте больше всего скоплений на той и остановиться. 
 
Vyacheslav Kornev:
У нас есть 50 ячеек и 11 кубиков с номерами
1, 3, 6, 8, 10, 11, 15, 16, 30, 40,50
V1. Самые плотные скопления это: 10,11 и 15,16. 

V2. Менее плотные это - 1,3 и 6,8,10,11 и 15,16

V3. Еще менее плотное это - 1,3,6,8,10,11 и 15,6

V4. Затем- 1,3,6,8,10,11,15,16. 

Итог таков. Мы подобрали дельту. То есть рассчитываем v2 потому что в этом варианте получилось больше всего скоплений

Скопление 1,3 занимает 3 ячейки из 50, то есть 1,5 ячейки на кубик. 

Скопление 6,8,10,11 занимает 6 ячеек. И здесь 1,5 ячейки на кубик.  Дальше продолжать не буду. 

Вы, не захотели выделять 10 и 11 в отдельное скопление. 










Посмотрите, является ли дельта 2 самой распространенной. И центром масс среди дельт здесь?

 
Пока не определитесь с чёткой формулой плотности и формулой сравнения двух разбиений на эти кластеры, то можно сколько угодной копий ломать. Т.е. должен быть численный критерий сравнения работы двух алгоритмов.
 
Vyacheslav Kornev:
Раз вы поняли, что чем больше дельта тем шире скопление. Почему вы говорите, что они левые?   Внутри большого скопления есть куча мелких

 

Все верно говорите - есть много мелких - возможно у меня в алгоритме логическая ошибка есть - надо подумать.

Vyacheslav Kornev:
А, до какой дельты считать, 
Ну, хех, среди всех дельт 
Самая часто встречающеяся. 

 Не - слишком большая вышла, хотя, может на других данных будет иная оценка.

Vyacheslav Kornev:
 
А вообще по методу нахождения центра масс. То есть среди дельт высчитывать дельты))

 Эммм, как Вы это представляете - излагайте алгоритм.

 

 

 

 

 

 
Vyacheslav Kornev:
 
Посмотрите, является ли дельта 2 самой распространенной. И центром масс среди дельт здесь?

 Дальнейшие теоретические изыскания осложнены из-за отсутствия достаточного числа тестов и оценки их результатов.

Без кода не очень хочется сейчас убивать время на работу в экселе - не продуктивно.

В итоге - алгоритм подлежит апробации на данных с целью проверки эффективности. 

 
Avals:
Пока не определитесь с чёткой формулой плотности и формулой сравнения двух разбиений на эти кластеры, то можно сколько угодной копий ломать. Т.е. должен быть численный критерий сравнения работы двух алгоритмов.

Предложите Ваши варианты для численной оценки - я ранее называл два варианта.

 

Внес изменение в код скрипта, теперь можно увидеть результаты работы прямо на графике - максимальная плотность выделяется отдельным цветом, период баров можно выбирать по дате или по барам от нуля - по умолчанию. 

Файлы:
 

Добавил измененную логику фильтра - кажется меньше шума - меняется параметром Variant - 0 - старый , а 1 - новый (по умолчанию).

Файлы:
 

Добавил фильтр по числу элементов в группе - 5 - можно менять. Чем больше цифр в числовом ряду, тем больше должно быть значение фильтра - возможно стоит сделать процент от максимального числа цифр в самой большой группе.

Вернул прежний алгоритм предварительной фильтрации числового ряда по умолчанию - 0.

 

Файлы:
 

Поправил расчет при смещение данных для вычисления.

Файлы: