L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2729

 
Aleksey Nikolayev #:

Il significato non sta nei criteri, ma nel modo in cui vengono utilizzati. Il vostro modo di usarli non è affatto chiaro: cosa confrontate con cosa e a quale scopo).

Ok, visto che fai il furbo, non sei disposto a pensare in questa direzione. Non mi dilungherò.

 
Aleksey Vyazmikin #:

Ok, se sei intelligente, allora non vuoi pensare in questa direzione. Non mi disturberò.

Alexei, impara a formulare i tuoi pensieri, se vuoi davvero essere capito...

 
mytarmailS #:

Alexei, impara a formulare i tuoi pensieri se vuoi essere compreso.

E dove hai perso il mio filo del discorso?

I miei pensieri sono formulati - capisco di cosa sto parlando, se qualcuno non capisce - chieda. Forse devi imparare a capire meglio l'essenza, senza aggrapparti ai termini....

 
Aleksey Vyazmikin #:

Ok, se sei intelligente, allora non vuoi pensare in questa direzione. Non mi disturberò.

O non sei in grado di formulare un'idea o non vuoi condividerla. In entrambi i casi non ha senso sviluppare ulteriormente l'argomento e facciamo a meno di andare sul personale.

 
Aleksey Vyazmikin #:

Pensate che il criterio non abbia senso? Prendiamo dieci campioni di dimensioni diverse e confrontiamoli - scegliamo quello con i punteggi migliori su diversi indicatori che sono responsabili della somiglianza/similarità/omogeneità dei campioni.

Se prendiamo e mescoliamo i campioni, otteniamo punteggi diversi... ci rattristiamo.

* mescolano i campioni tra loro. Poiché nessuno lo vieta, poiché non si tratta di un modello sequenziale in fase di addestramento, la sequenza dei campioni non ha importanza. Conta solo l'errore di classificazione, che può sempre essere ridotto mescolando.

Per cercare qualcosa, è necessario capire con precisione cosa si sta cercando, altrimenti si giocherà con i campioni fino a rimanere stupefatti. Nessuno sa cosa si stia cercando, se qualcuno lo scopre me lo faccia sapere.
 
C'è un altro trucco. Più le caratteristiche non sono informative, più il campione di addestramento dovrebbe essere piccolo.

Più gli attributi sono informativi e sono meno numerosi, più il campione può/deve essere grande. Ma quasi tutti pensano il contrario.
 
Aleksey Nikolayev #:

O non riuscite a formulare un'idea o non volete condividerla. In entrambi i casi non ha senso sviluppare ulteriormente l'argomento e facciamo a meno di andare sul personale.

Non ho forse scritto che l'idea è quella di confrontare i campioni (di allenamento e di applicazione), che se la tua teoria è corretta, il campione cesserà di essere simile man mano che aumenta, e che per capire questo hai bisogno di criteri per valutare il suo cambiamento, che derivano dai metodi di valutazione della somiglianza?

Inoltre, ho parlato di suddividere l'intero campione in sezioni in base a qualche caratteristica di tendenza comparabile, e di classificare all'interno di questi gruppi. E tale classificazione può essere fatta con criteri di "somiglianza" dei campioni.

Non sto andando sul personale - vedo lo stile della risposta, e sono solo perplesso - cosa stanno facendo le persone qui - vogliono mostrare la loro unicità? Sono interessato a trovare modi per risolvere il problema, sono interessato a utilizzare le conoscenze degli altri e a condividere le mie.

 
Maxim Dmitrievsky #:
Prelevare e mescolare campioni, ottenere diverse stime... triste

* mischiarli tra loro. Poiché nessuno lo vieta, poiché non si sta addestrando un modello sequenziale, la sequenza dei campioni non ha importanza. Conta solo l'errore di classificazione, che può sempre essere ridotto mescolando.

Per cercare qualcosa, è necessario capire con precisione cosa si sta cercando, altrimenti si giocherà con i campioni fino a rimanere stupefatti. Nessuno sa cosa si stia cercando, quindi se qualcuno lo scopre me lo faccia sapere.

Si può mescolare solo all'interno di un campione, se si mescolano due campioni, significa negare che il mercato sta cambiando.

 
Maxim Dmitrievsky #:
Prelevare e mescolare campioni, ottenere diverse stime... triste

* mischiarli tra loro. Poiché nessuno lo vieta, poiché non si sta addestrando un modello sequenziale, la sequenza dei campioni non ha importanza. Conta solo l'errore di classificazione, che può sempre essere ridotto mescolando.

Per cercare qualcosa, è necessario capire con precisione cosa si sta cercando, altrimenti si giocherà con i campioni fino a rimanere stupefatti. Nessuno sa cosa si stia cercando, quindi se qualcuno lo scopre me lo faccia sapere.

Non mi piace molto quello che tu e Alexey avete in comune nei vostri ragionamenti: li avete fatti nel contesto di un modello specifico e studiando il suo comportamento quando il campione di allenamento cambia. Idealmente, vorrei essere indipendente da un particolare modello quando seleziono il campione di addestramento - ecco perché per ora ho deciso di usare i vertici a zig-zag. Ma probabilmente avete ragione entrambi e la completa indipendenza dal tipo di TC è difficilmente possibile.

 
Aleksey Vyazmikin #:

Non ho forse scritto che l'idea di confrontare i campioni (di addestramento e di applicazione) è che, se la vostra teoria è corretta, il campione cesserà di essere simile man mano che aumenta, e per rendersene conto avete bisogno di criteri per valutare il suo cambiamento, che derivano dai metodi di valutazione della somiglianza?

Qui si parla apparentemente di campioni multivariati (ogni elemento è una riga di una tabella, un vettore), mentre i criteri di omogeneità nei vostri tre link riguardano campioni numerici. I criteri di omogeneità multivariata in matstat sono un brano a parte e non mi sono del tutto chiari.

Aleksey Vyazmikin #:

Inoltre, stavo parlando di suddividere l'intero campione in sezioni in base a qualche caratteristica di tendenza comparabile, e di classificare all'interno di questi gruppi. E tale classificazione può essere fatta anche in base ai criteri di "somiglianza" dei campioni.

È un compito simile a quello della ricerca di molti punti di cambiamento. Anche in questo caso si scopre che dobbiamo lavorare con un caso multidimensionale (vettore), il che complica molto la questione.

In generale, non mi piace la dipendenza dagli attributi scelti per lo studio. Se prendiamo set diversi di attributi, i risultati possono essere diversi.