Algoritmo per combinare gli intervalli di un segmento - aiuta a creare - pagina 6

 
Aleksey Vyazmikin:

Che differenza fa se i percorsi sono lunghi o corti, o è una questione di stima (la lunghezza della freccia nell'analogia della figura)?

Abbiamo il desiderio di calpestare i due percorsi migliori nell'esempio, se ce ne sono meno allora c'è un percorso.

Per favore, spiega perché questo potrebbe essere un problema.

Se ci sono sentieri corti e lunghi in un insieme, allora se si arriva alla zona con solo sentieri lunghi, il percorso sarà più lungo che se si arriva alla zona con sentieri corti. Per esempio, all'inizio come nella tua foto, e poi ci sono due aree parallele tra loro, e nella prima area, i segmenti sono 3 volte più corti che nella seconda area e occupano il 75% del percorso.

 
Valeriy Yastremskiy:

Se nell'insieme ci sono aree con segmenti corti e lunghi, allora se si arriva all'area con solo segmenti lunghi, il percorso sarà più lungo che se si arriva all'area con segmenti corti. Per esempio, all'inizio, come nel tuo disegno, e poi ci sono due aree parallele tra loro, e nella prima area, i segmenti sono 3 volte più corti che nella seconda area e occupano il 75% del percorso.

Il movimento inizierà da ogni segmento, quindi devi passare anche attraverso quelle aree.

 
Aleksey Vyazmikin:

Il movimento partirà da ogni segmento, quindi deve passare anche per quelle aree.

Il movimento può iniziare da qualsiasi segmento, ma è chiaro che i punti con segmenti lunghi non sono necessari. Nel tuo algoritmo hai solo relazioni con i segmenti più vicini, non con nessun segmento, e se colpisci un punto con segmenti lunghi, e punti vicini con solo segmenti lunghi, questo non è un buon risultato.

 
Valeriy Yastremskiy:

Il movimento può iniziare da qualsiasi segmento, ma è chiaro che i punti di segmento lunghi non sono necessari. Nel tuo algoritmo hai solo relazioni con i segmenti più vicini, non con nessun segmento, e se arrivi a un punto con segmenti lunghi, e vicino a punti con solo segmenti lunghi, non è il miglior risultato.

La "lunghezza" qui è relativa, finché non si arriva a un punto che non si può misurare.

Un'altra cosa è la stima in analoghi composti, quando un segmento è rappresentato da due, allora sì, possiamo eliminare un segmento.

 
Aleksey Vyazmikin:

La "lunghezza" qui è relativa, finché non arriviamo a un punto che non possiamo misurare.

Un'altra cosa è la stima sugli analoghi composti, quando un segmento è rappresentato da due, allora sì, possiamo abbandonare un segmento.

Non capisco. Se la lunghezza/prezzo può essere guardata solo colpendo un punto, è un compito molto più difficile. E senza una stima del prezzo/lunghezza sufficientemente completa, il risultato non può essere stimato in modo affidabile.

Non è chiaro sugli analoghi compositi.

 
Valeriy Yastremskiy:

Non capisco. Se la lunghezza/prezzo può essere vista solo colpendo un punto, è un compito molto più difficile. E senza una stima prezzo/lunghezza sufficientemente completa, il risultato non può essere valutato in modo affidabile.

Sì, è così.

Valeriy Yastremskiy:

Non è chiaro riguardo agli analoghi compositi.

Nella figura qui sotto abbiamo due segmenti grandi e 5 piccoli sotto di loro, ma si può vedere che sono sullo stesso intervallo e quindi essenzialmente descrivono una zona simile.

L'unica domanda è quale sia meglio - le barre più piccole che danno la possibilità a ciascuno di loro di trovare un predittore correlato e avere un cutoff più accurato, o la maggiore capacità di generalizzazione nella barra più grande. Penso che i cutoff poco profondi siano migliori, il loro minimo è limitato nella selezione.

 

Un altro pensiero è venuto, perché non prendere effettivamente il migliore x% dei segmenti e usarli per riempire lo spazio nel primo passo, e nel secondo passo identificare i vuoti tra i segmenti e cercare segmenti da incorporare in questi vuoti.

La figura mostra convenzionalmente due fasi.


 
Aleksey Vyazmikin:

Un altro pensiero è venuto, perché non prendere effettivamente il migliore x% dei segmenti e usarli per riempire lo spazio nel primo passo, e nel secondo passo identificare i vuoti tra i segmenti e cercare segmenti da incorporare in questi vuoti.

Nella figura ho mostrato le due fasi in modo condizionale.


Beh, è quello che sto cercando di dire, prima stimare lunghezze/valori dai punti, identificare più segmenti di valore e tossici e poi costruire un percorso basato sui valori dei segmenti e sulla capacità di riempire al meglio il percorso senza lacune.

Come minimo la soluzione non sarà la migliore, ma sarà migliore della media.

 

La domanda è fuori tema e piuttosto filosofica. Ci si rende conto che l'approccio alla classificazione attraverso la divisione degli attributi in segmenti implica una dipendenza discontinua degli output dagli input? Cioè, può verificarsi una situazione in cui un'operazione si aprirà ad un insieme di attributi e non si aprirà ad un altro molto, molto vicino al primo (sono vicini al confine, ma su lati opposti di esso). Non sto dicendo che è un approccio sbagliato. Voglio solo chiedere - c'è una sorta di intuizione del trader dietro o è una scelta arbitraria?

Come possibile alternativa, si può suggerire la classificazione tramite regressione logistica o il metodo del vicino più vicino. L'output può contenere la stima della probabilità di appartenere a una classe, che può essere usata, per esempio, per determinare il volume degli scambi. Non insisto su nessun algoritmo particolare, sono solo interessato all'aspetto trader della scelta di un particolare algoritmo MO.

 
Valeriy Yastremskiy:

Questo è quello che sto cercando di dire, prima stimare le lunghezze/valori dai punti, identificare i molti segmenti di valore e tossici e poi costruire un percorso basato sui valori dei segmenti e la capacità di riempire al meglio il percorso senza lacune.

Come minimo la soluzione non sarà la migliore, ma sarà migliore della media.

La questione qui è come identificare "molti segmenti di valore e tossici" - cioè bisogna identificare la loro intercambiabilità, o farlo in due passaggi, come ho suggerito prima. O hai un'altra opzione?