Algoritmo para combinar faixas de um segmento - ajuda a criar - página 6

 
Aleksey Vyazmikin:

Que diferença faz se os caminhos são longos ou curtos, ou é uma questão de estimativa (o comprimento da seta na analogia da figura)?

Temos o desejo de pisar nos dois melhores caminhos do exemplo, se houver menos do que um caminho.

Por favor, explique por que isto pode ser um problema.

Se houver caminhos longos e curtos no conjunto, o caminho é mais longo se você entrar na área com apenas caminhos longos do que se você entrar na área com caminhos curtos. Por exemplo, no início como em sua foto, e depois há duas áreas paralelas uma à outra, e na primeira área, os segmentos são 3 vezes mais curtos que na segunda área e ocupam 75% do caminho.

 
Valeriy Yastremskiy:

Se houver áreas com segmentos curtos e longos no conjunto, então se você chegar à área com apenas segmentos longos, o caminho será mais longo do que se você chegar à área com segmentos curtos. Por exemplo, no início, como em seu desenho, e depois há duas áreas paralelas uma à outra, e na primeira área, os segmentos são 3 vezes mais curtos que na segunda área e ocupam 75% do caminho.

O movimento começará a partir de cada segmento, portanto você deve passar por essas áreas também.

 
Aleksey Vyazmikin:

O movimento começará a partir de cada segmento, portanto deve passar por essas áreas também.

O movimento pode partir de qualquer segmento, mas é claro que pontos com segmentos longos não são necessários. Em seu algoritmo você só tem relações com os segmentos mais próximos, não com nenhum segmento, e se você atingir um ponto com segmentos longos, e pontos próximos com apenas segmentos longos, este não é um bom resultado.

 
Valeriy Yastremskiy:

O movimento pode começar de qualquer segmento, mas é claro que não são necessários pontos de segmento longos. Em seu algoritmo você só tem relações com os segmentos mais próximos, não com nenhum segmento, e se você chegar a um ponto com segmentos longos, e próximo a pontos com apenas segmentos longos, não é o melhor resultado.

O "comprimento" é relativo aqui, até chegar a um ponto que não se pode medir.

Outra coisa é a estimativa em analógicos compostos, quando um segmento é representado por dois, então sim, podemos deixar cair um segmento.

 
Aleksey Vyazmikin:

O "comprimento" aqui é relativo, até chegarmos a um ponto em que não podemos medi-lo.

Outra coisa é a estimativa em analógicos compostos, quando um segmento é representado por dois, então sim, podemos deixar cair um segmento.

Eu não entendo. Se o comprimento/preço só pode ser visto atingindo um ponto, é uma tarefa muito mais difícil. E sem uma estimativa suficientemente completa dos preços/comprimento, o resultado não pode ser avaliado de forma confiável.

Não está claro sobre os analógicos compostos.

 
Valeriy Yastremskiy:

Eu não entendo. Se o comprimento/preço só pode ser visto atingindo um ponto, é uma tarefa muito mais difícil. E sem uma estimativa de preço/comprimento suficientemente completa, o resultado não pode ser avaliado de forma confiável.

Sim, é.

Valeriy Yastremskiy:

Não está claro sobre os analógicos compostos.

Na figura abaixo temos dois grandes segmentos e cinco pequenos abaixo deles, mas você pode ver que eles estão na mesma faixa e, portanto, essencialmente descrevem uma área semelhante.

A única questão é qual é melhor - as barras menores dando a possibilidade para cada uma delas encontrar um preditor correlato e ter um corte mais preciso, ou a maior capacidade de generalização na barra maior. Penso que os cortes superficiais são melhores, seu mínimo é limitado na seleção.

 

Outro pensamento ocorreu, por que não pegar o melhor x% dos segmentos e usá-los para preencher o espaço na primeira etapa, e na segunda etapa identificar as lacunas entre os segmentos e procurar por segmentos a serem embutidos nessas lacunas.

A figura mostra convencionalmente duas etapas.


 
Aleksey Vyazmikin:

Outro pensamento ocorreu, por que não pegar o melhor x% dos segmentos e usá-los para preencher o espaço na primeira etapa, e na segunda etapa identificar as lacunas entre os segmentos e procurar por segmentos a serem embutidos nessas lacunas.

Na figura eu mostrei as duas etapas condicionalmente.


Bem, é isso que estou tentando dizer, primeiro estime os comprimentos/valores dos pontos, identifique múltiplos segmentos valiosos e tóxicos e depois construa um caminho baseado nos valores dos segmentos e na capacidade de melhor preencher o caminho sem lacunas.

No mínimo, a solução não será a melhor, mas será melhor do que a média.

 

A questão é fora de tópico e bastante filosófica. Já se deu conta de que a abordagem da classificação através da divisão dos atributos em segmentos implica uma dependência descontínua das saídas em relação às entradas? Ou seja, uma situação pode surgir quando um comércio se abre em um conjunto de atributos e não se abre em outro muito, muito próximo do primeiro (eles estão perto do limite, mas em lados opostos). Não estou dizendo que esta é a abordagem errada. Eu só quero perguntar - existe algum tipo de intuição de comerciante por trás disso ou é uma escolha arbitrária?

Como alternativa possível, pode-se sugerir a classificação via regressão logística ou o método do vizinho mais próximo. A saída pode conter a estimativa da probabilidade de pertencer a uma classe, que pode ser usada, por exemplo, para determinar o volume de comércio. Não insisto em nenhum algoritmo em particular, apenas interessado no aspecto comercial da escolha de um algoritmo MO em particular.

 
Valeriy Yastremskiy:

É o que estou tentando dizer, primeiro estimar o comprimento/valores dos pontos, identificar os muitos segmentos valiosos e tóxicos e depois construir um caminho baseado nos valores dos segmentos e na capacidade de melhor preencher o caminho sem lacunas.

No mínimo, a solução não será a melhor, mas será melhor do que a média.

A questão aqui é como identificar "muitos segmentos valiosos e tóxicos" - ou seja, você precisa identificar sua intercambialidade, ou fazê-lo em dois passes, como sugeri anteriormente. Ou você tem outra opção?