Ищу название алгоритма - страница 6

 
alexeymosc:

Рискну предположить, что СКП Кохонена в любом случае (при нескольких экспериментах) будет сходится примерно к одному "положению прямой".

сильно сомневаюсь ;)

все не просто "зависит от" а именно "определяется" точкой зрения. С одной точки зрения (читай используемой методики классификации или обучения) получится одна прямая, но если учесть еще парутройку факторов, то ее положение да и вообще сам факт возможности существования такой линии окажется под большущим вопросом.

Автор слегка лукавит сам с собой и чтобы это стало нагляднее - немного перероформулируем его задачу. Возьмем нашу галлактику с миллиардами звезд както размазанными по пространству. (Допустим что) у нас есть возможность получить расстояния между каждой парой звезд (забудем пока про необходимый для этого объем памяти)... ну? вроде все как в его задаче ;)

ну а теперь его вопрос: расположите мне все эти звезды "в одну линию так, чтобы соблюсти максимально точно отношения расстояний между ними". как любят спрашивать в анекдотах: сам то понял что сказал? :))))))

а ведь задача то - один-в-один по его постановке. применяя научный метод познания "по-аналогии", я говорю: нет у этой задачи в такой постановке решения впринципе.

 
f.t.:


ну а теперь его вопрос: расположите мне все эти звезды "в одну линию так, чтобы соблюсти максимально точно отношения расстояний между ними". как любят спрашивать в анекдотах: сам то понял что сказал? :))))))

а ведь задача то - один-в-один по его постановке. применяя научный метод познания "по-аналогии", я говорю: нет у этой задачи в такой постановке решения впринципе.

Максимально точно соблюсти отношения расстояний точно не получится. Согласен с Вами. Можно только скопления точек в гиперкубе перенести в скопления на прямой (при допущении, что алгоритм выберет наиболее удачное расположение прямой). Но детали будут потеряны.
 
И, как говорится, "а зачем это нужно вообще"? В принципе, плоскость СКП дает достаточное представление структуры многомерных данных. А уж сворачивать плоскость в прямую это как-то излишне.
 

А вот еще интересный аспект задачи топикстартера. Можно использовать нейросеть с автоассоциативной памятью (узким горлом) и ужать изначальное пространство признаков в более компактное, теоретически, даже в одну точку. Но при этом переходе все шумовые характеристики координат точек из выборки будут потеряны, тоже будет огрубление исходных данных.

 

если речь о задаче которую поставил lasso (о 3ёх точках), то задачу можно решить полным перебором. Целевая функция - максимальное евклидово расстояние между 3мя точками как сумма растояний между первой и второй, первой и третьей, второй и третьей. Фактически максимизация периметра образованного треугольника

З.Ы. можно рассмотреть как максимизацию площади треугольника, так наверное логичнее будет. В общем, главное задать правильную целевую функцию - как нравится автору)))