세그먼트 범위를 결합하는 알고리즘 - 생성에 도움 - 페이지 6

 
Aleksey Vyazmikin :

어떤 세그먼트가 길거나 짧은지, 아니면 추정치(화살표의 길이, 그림과 유사)에 관한 것입니까?

우리는 예에서 두 가지 최선의 경로를 밟고자 하는 바람이 있습니다. 그 중 더 적은 수의 경우 경로는 하나뿐입니다.

이것이 왜 어려울 수 있는지 설명해 주십시오.

세트에 짧은 세그먼트와 긴 세그먼트가 있는 영역이 포함된 경우 긴 세그먼트만 있는 영역에 들어가면 짧은 세그먼트가 있는 영역에 들어갈 때보다 경로가 더 길어집니다. 예를 들어, 처음에는 그림과 같이 두 개의 영역이 있고 서로 평행한 두 영역이 있으며 첫 번째 영역에서는 세그먼트가 두 번째 영역보다 3배 짧고 이 영역을 75% 차지합니다. .

 
Valeriy Yastremskiy :

세트에 짧은 세그먼트와 긴 세그먼트가 있는 영역이 포함된 경우 긴 세그먼트만 있는 영역에 들어가면 짧은 세그먼트가 있는 영역에 들어갈 때보다 경로가 더 길어집니다. 예를 들어, 처음에는 그림과 같이 두 개의 영역이 있고 서로 평행한 두 영역이 있으며 첫 번째 영역에서는 세그먼트가 두 번째 영역보다 3배 짧고 이 영역을 75% 차지합니다. .

이동은 각 세그먼트에서 시작되므로 해당 영역을 통과해야 합니다.

 
Aleksey Vyazmikin :

이동은 각 세그먼트에서 시작되므로 해당 영역을 통과해야 합니다.

움직임은 모든 세그먼트에서 시작할 수 있지만 긴 세그먼트가 있는 포인트가 필요하지 않다는 것은 분명합니다. 알고리즘에서 가장 가까운 세그먼트와만 관계가 있고 어떤 것과도 관계가 없습니다. 긴 세그먼트가 있는 지점과 긴 세그먼트만 있는 지점 옆에 있는 경우 최상의 결과가 아닙니다.

 
Valeriy Yastremskiy :

움직임은 모든 세그먼트에서 시작할 수 있지만 긴 세그먼트가 있는 포인트가 필요하지 않다는 것은 분명합니다. 알고리즘에서 가장 가까운 세그먼트와만 관계가 있고 어떤 것과도 관계가 없습니다. 긴 세그먼트가 있는 지점과 긴 세그먼트만 있는 지점 옆에 있는 경우 최상의 결과가 아닙니다.

여기서 "길이"는 측정할 수 없는 지점에 도달할 때까지 상대적입니다.

또 다른 것은 복합 아날로그에 대한 평가입니다. 하나의 세그먼트가 두 개로 표시되면 네, 하나의 세그먼트를 버릴 수 있습니다.

 
Aleksey Vyazmikin :

여기서 "길이"는 측정할 수 없는 지점에 도달할 때까지 상대적입니다.

또 다른 것은 복합 아날로그에 대한 평가입니다. 하나의 세그먼트가 두 개로 표시되면 네, 하나의 세그먼트를 버릴 수 있습니다.

이해하지 못했습니다. 길이/가격이 현장을 보아야만 알 수 있다면 훨씬 더 어려운 작업입니다. 그리고 가격/길이에 대한 충분히 완전한 평가 없이는 결과를 안정적으로 평가할 수 없습니다.

복합 유사체에 대해서는 명확하지 않습니다.

 
Valeriy Yastremskiy :

이해하지 못했습니다. 길이/가격이 현장을 보아야만 알 수 있다면 훨씬 더 어려운 작업입니다. 그리고 가격/길이에 대한 충분히 완전한 평가 없이는 결과를 안정적으로 평가할 수 없습니다.

응 그게 맞아.

발레리 야스트렘스키 :

복합 유사체에 대해서는 명확하지 않습니다.

아래 그림에서 두 개의 큰 세그먼트와 그 아래에 5개의 작은 세그먼트가 있지만 동일한 범위에 있음을 알 수 있습니다. 즉, 본질적으로 유사한 영역을 설명한다는 의미입니다.

유일한 질문은 더 나은 것입니다. 더 작은 세그먼트는 각각이 해당 예측 변수를 찾고 더 정확한 세그먼트 또는 더 큰 세그먼트에서 더 큰 일반화 능력을 가질 수 있도록 합니다. 나는 작은 조각이 더 낫다고 생각하며 최소한의 선택은 제한되어 있습니다.

 

또 다른 생각이 떠올랐습니다. 첫 번째 단계에서 세그먼트의 가장 좋은 x%를 가져와 공간을 도움으로 채우고 두 번째 단계에서 세그먼트 사이의 간격을 식별하고 이러한 간격에 삽입할 세그먼트를 찾는 것이 어떻습니까? .

그림은 조건부로 두 단계를 보여줍니다.


 
Aleksey Vyazmikin :

또 다른 생각이 떠올랐습니다. 첫 번째 단계에서 세그먼트의 가장 좋은 x%를 가져와 공간을 도움으로 채우고 두 번째 단계에서 세그먼트 사이의 간격을 식별하고 이러한 간격에 삽입할 세그먼트를 찾는 것이 어떻습니까? .

그림은 조건부로 두 단계를 보여줍니다.


글쎄, 나는 이것에 대해 말하려고합니다. 먼저 포인트에서 길이 / 가격을 추정하고 많은 가치있는 세그먼트와 유독 한 세그먼트를 식별 한 다음 세그먼트의 가치와 능력을 기반으로 경로를 구축 중단 없이 경로를 가장 완벽하게 채웁니다.

적어도 솔루션은 최고는 아니지만 평균보다는 나을 것입니다.

 

질문은 주제에서 벗어나 더 철학적입니다. 기능을 세그먼트로 분할하여 분류하는 접근 방식은 입력에 대한 출력의 불연속적인 종속성을 의미한다는 것을 알고 있습니까? 즉, 거래가 한 속성 값 집합으로 시작되고 첫 번째 속성 값에 매우 매우 가까운 다른 속성 값 집합으로 거래가 열리지 않을 때 상황이 발생할 수 있습니다(경계 근처에 있지만 반대쪽에 있음). 이것이 잘못된 접근이라고 말하는 것이 아닙니다. 저는 묻고 싶습니다. 트레이더의 직관이 이면에 있습니까, 아니면 임의적인 선택입니까?

가능한 대안으로 로지스틱 회귀 또는 최근접 이웃 방법을 통한 분류를 제안할 수 있습니다. 출력에서 클래스에 속할 확률의 추정치를 얻을 수 있습니다. 예를 들어 트랜잭션의 양을 결정하는 데 사용할 수 있습니다. 나는 특정 알고리즘을 주장하지 않으며 특정 MO 알고리즘을 선택하는 상인의 측면에 관심이 있습니다.

 
Valeriy Yastremskiy :

글쎄, 나는 이것에 대해 말하려고합니다. 먼저 포인트에서 길이 / 가격을 추정하고 많은 가치있는 세그먼트와 유독 한 세그먼트를 식별 한 다음 세그먼트의 가치와 능력을 기반으로 경로를 구축 중단 없이 경로를 가장 완벽하게 채웁니다.

최소한 솔루션이 최고는 아니지만 평균보다는 나을 것입니다.

여기서 문제는 "많은 가치 있는 세그먼트와 유독한 세그먼트"를 식별하는 방법입니다. 이전에 제안한 대로 상호 호환성을 식별하거나 두 단계로 수행해야 합니다. 아니면 다른 옵션이 있습니까?