L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3190

 
Aleksey Nikolayev #:

Rapportarlo in qualche modo al profitto, almeno approssimativamente, e confrontare il profitto reale con un campione di profitti casuali. La verifica dell'assenza di errori è che il profitto medio del campione sia uguale a zero. Verificare la significatività della positività del profitto reale rispetto al campione - la regola dei tre sigma.

Non sono pronto a entrare nei dettagli del vostro compito, poiché i miei compiti sono troppo impegnativi.

Cosa c'entra il profitto, quando si parla di preelaborazione dei dati per un'ulteriore classificazione?

Aleksey Nikolayev #:

I vostri quanti sono progettati per l'estrazione del profitto? Esiste uno schema per questo? Si tratta di una semplificazione estrema per calcolare anche solo approssimativamente ma rapidamente un campione e verificare se il risultato reale cade nella coda di questo campione.

La tua volontà di richiedere alle persone di approfondire la tua mentalità, accompagnata dalla tua completa indisponibilità ad approfondire idee semplici e ampiamente conosciute come Monte Carlo, è stancante.

Credo di averne avuto abbastanza.

Ognuno ha il diritto di gestire il proprio tempo.

Ma, a quanto pare, non ha capito la domanda per la quale ha dato un consiglio.

Grazie per aver cercato di aiutare.

 
Aleksey Vyazmikin #:

Capisco.

Ho un altro suggerimento da darvi, e se per rendere più maneggevole il processo di costruzione della foresta, e prendere come radice per ogni albero un sottocampione concreto del segmento quantistico selezionato?

La profondità dovrebbe essere di 2-3 spaccature, in modo che gli esempi di classe classificabile per foglia non siano inferiori all'1%.

Penso che il modello sarà più stabile.

Cioè, se si selezionano 10 quanti/split, si addestrano 10 alberi su esempi provenienti da questi split? Sembra semplice da fare.
Riguardo alla stabilità su OOS - l'esperimento lo dimostrerà. La mia stabilità viene violata quando si cambia la dimensione della finestra di dati (2 mesi e 4) e quando la si sposta anche del 2% (addestramento il martedì invece del sabato). Gli alberi risultano diversi.

Aleksey Vyazmikin #:

Ho condotto un esperimento con il campione su cui ho pubblicato le gif, ci sono già il 47% di unità nel campione, i dati sono stati riassunti nella tabella.

...
è risultato che la qualità (utilità) di questi segmenti quantistici è peggiore (inferiore) rispetto a quelli originali di 10 volte.

Quando ho comunicato con fxsaber, ho ipotizzato che tale peggioramento (in termini di tempi) fosse dovuto alla miscelazione con il suo algoritmo. Lui non ha una differenza così forte nei suoi dati. Apparentemente perché non ha tutte le barre in fila nel markup (o le righe in fila), ma con ampi spazi vuoti. Se le barre sono vicine, hanno un passato e un futuro molto simili, cioè 20 esempi della classe 1 possono essere in fila. Randomizzandole si ottiene una media di 0101010.... e si dovrebbe cambiare l'intera serie di 20 "1" in 20 "0". Poiché sono vicini e possono essere contati come un unico esempio. Se non è così per te, è così per me (valuto tutte le barre di seguito, ecco perché è nata questa idea).

In generale, penso che con una differenza così forte di 10 volte, è possibile non fare 10000 test. Troppo evidente la differenza nei primi 10 test (tutti peggiori) per supporre che altri 10000 aumenteranno il risultato fino a renderlo uguale all'originale. Se i risultati sono stati 3 peggiori, 3 migliori, 4 più o meno uguali, allora sì - continuate ad accumulare statistiche.

Se i dati sono serializzati, il problema è che una serie di 20 1 da qualche parte nella storia troverà una serie di 20 0 con un passato simile. Qui si tratta di randomizzazione del mercato. Non nel trasformare 111111111 in 010101010.

UPD Quindi penso che Monte Carlo nella forma di 01010101 per i dati di mercato non funzionerà per i dati di mercato (se vanno in serie). È come dividere un rettangolo e un quadrato in quadrati uguali e poi cercare di determinare a quale figura primaria appartenesse il quadrato)).

 
Aleksey Vyazmikin #:

Ho scritto della sequenza rigorosa solo come esempio per chiarezza. E ho scritto che la soluzione di questo problema può migliorare la stabilità del modello. Ma la soluzione può essere diversa.

Anche senza risolvere il problema di cui sopra, la selezione della tabella quantistica corretta migliora l'apprendimento, come ho avuto modo di verificare su decine di campioni.

Poi ho mostrato come è possibile eseguire rapidamente la preelaborazione per l'addestramento, ripulendo il campione dai dati incoerenti. Nelle immagini si può vedere che con questo metodo è possibile ottenere un modello redditizio anche su nuovi dati.

Alla fine, l'approccio funziona e il suo sviluppo è il mio obiettivo.

Pertanto, dire che non funziona significa negare la realtà.

Non credo che il prezzo sia un puro SB, la cui natura non può essere almeno parzialmente smontata. Se si tratta di puro SB, allora l'intero thread è un errore.

Credo che dovremmo fare una conferenza dei macchinisti. Ovviamente con un buffet e da qualche parte negli Emirati Arabi. E lì in un'atmosfera formale e poi informale per discutere di tutto. Altrimenti è scomodo farlo attraverso il forum.

Il programma sarebbe questo: un giorno conferenza, un giorno tutti bevono, il giorno dopo tutti litigano, si tirano le tette a vicenda, poi di nuovo conferenza e così via di seguito. Al volo :)

Lo sponsor e il relatore principale sarebbe Saber, poi Alexei Nikolaev, poi tutti gli altri :)
 
Aleksey Vyazmikin #:

Cosa c'entra il profitto con la preelaborazione dei dati per un'ulteriore classificazione?

Qual era il senso delle tue numerose gif con bilanci in costante aumento? Forse non hai capito la risposta alla tua domanda?

 
Maxim Dmitrievsky #:
Penso che dovremmo organizzare una conferenza sulle macchine. Dovrebbe includere un buffet e tenersi da qualche parte negli Emirati Arabi Uniti. E lì in un'atmosfera formale e poi informale per discutere di tutto. Altrimenti è scomodo farlo attraverso il forum.

Il programma sarebbe questo: un giorno conferenza, un giorno tutti bevono, il giorno dopo tutti litigano, si tirano le tette a vicenda, poi conferenza di nuovo e così via di seguito. Al volo :)

Lo sponsor e l'oratore principale sarebbero Saber, poi Alexei Nikolaev, poi tutti gli altri :)

L'idea dei soldi di Saber per familiarizzare con le sue strategie mi sembra ottima e ben pensata. Non so nemmeno cosa potrebbe andare storto 🤔

 
Aleksey Nikolayev #:

L'idea dei soldi di Saber per familiarizzare con le sue strategie mi sembra ottima e ben pensata. Non so nemmeno cosa potrebbe andare storto 🤔

😀😀😀 ho dimenticato di aggiungere - main sponsor come il più vincente. Ma tutti devono contribuire.
Penso che sia possibile trovare persone che sponsorizzino il suo intervento.

Lo scopo della conferenza non è probabilmente quello di discutere strategie specifiche, ma approcci generali, filosofia, strumenti e così via.
 
Forester #:

Cioè, se si selezionano 10 quanti/segmenti, si addestrano 10 alberi utilizzando gli esempi di questi segmenti? Sembra semplice da fare.
Riguardo alla stabilità su OOS - l'esperimento lo dimostrerà. La mia stabilità viene violata quando si cambia la dimensione della finestra di dati (2 mesi e 4) e quando la si sposta anche del 2% (addestramento il martedì invece del sabato). Gli alberi risultano diversi.

Sì, è tutto così - l'approccio può essere reso più complicato, naturalmente, ma solo se lo si vuole.

Al momento, se ricordo bene, il predittore nell'albero colpisce solo la metà dell'intervallo, senza cercare il posto migliore per dividere?

Per quanto riguarda il successo dell'idea - sono assolutamente d'accordo, ma l'acqua non scorre nemmeno sotto una pietra sdraiata.

Forester #:

Ho pensato a questo peggioramento (di volte) quando ho parlato con fxsaber della miscelazione con il suo algoritmo. Lui non ha una differenza così forte nei suoi dati. Apparentemente perché non ha tutte le barre in fila nel markup (o le righe in fila), ma con ampi spazi vuoti. Se le barre sono vicine, hanno un passato e un futuro molto simili, cioè 20 esempi della classe 1 possono essere in fila. Randomizzandole si ottiene una media di 0101010.... e si dovrebbe cambiare l'intera serie di 20 "1" in 20 "0". Poiché sono vicini e possono essere contati come un unico esempio. Se non è così per voi, è così per me (valuto tutte le barre in fila, ecco perché mi è venuta questa idea).


In generale, penso che con una differenza così forte di 10 volte, sia possibile non fare 10000 test. Troppo evidente la differenza nei primi 10 test (tutti peggiori) per supporre che altri 10000 porteranno il risultato all'uguaglianza con l'originale. Se i risultati erano 3 peggiori, 3 migliori, 4 più o meno uguali, allora sì - continuate ad accumulare statistiche.

Se i dati sono serializzati, il problema è che una serie di 20 1 da qualche parte nella storia troverà una serie di 20 0 con un passato simile. Qui si tratta di randomizzazione del mercato. Non nel trasformare 111111111 in 010101010.

UPD Quindi penso che Monte Carlo nella forma di 01010101 per i dati di mercato non funzionerà per i dati di mercato (se vanno in serie). È come dividere un rettangolo e un quadrato in quadrati uguali e poi cercare di determinare a quale forma primaria appartenesse il quadrato)).

Sfortunatamente, ho commesso un errore durante l'elaborazione dei dati (stavo riprogettando velocemente lo script per questi test e una sfumatura non è stata presa in considerazione), e il risultato è una tabella come questa

La conclusione è che i dati possono rientrare casualmente negli intervalli delle tabelle quantistiche e superare il test di stabilità disponibile. Sono state utilizzate impostazioni/criteri predefiniti - ora proverò a stringerli e a vedere il risultato.

Tuttavia, ho scritto in precedenza che solo il 30% circa dei cutoff quantistici mostra la propria efficienza sugli altri due campioni, quindi il risultato era generalmente prevedibile. È stata solo la sua stranezza a farmi ricontrollare tutto. Come migliorare il risultato della selezione è la sfida.

Tuttavia, lo scopo della quantizzazione è quello di selezionare un gruppo con uno spostamento di probabilità. È possibile che attraverso la suddivisione si possa trovare una foglia stabile al suo interno, nonostante il gruppo stesso si sposti verso un altro obiettivo in base ai nuovi dati.

Nel campione su cui ho fatto l'esperimento - c'è una media di 1 segnale al giorno, credo, quindi le barre sono molto distanti.

Credo che sarebbe più interessante esaminare i risultati dell'esperimento che ho suggerito in precedenza: dovrebbe mostrare la frequenza con cui le risposte al target generate casualmente rientrano nei segmenti quantici campionati. Proprio questo sarà il "forziere" a distanza fissa, come suggerito da Aleksey Nikolayev nella sua astrazione.

Potete inviare il vostro campione, io selezionerò i segmenti quantici e su questi dati potrete sperimentare la creazione di una foresta modificata, oppure posso darvi il mio campione.

 
Maxim Dmitrievsky #:
Penso che dovremmo organizzare una conferenza sulle macchine. Dovrebbe includere un buffet e tenersi da qualche parte negli Emirati Arabi Uniti. E lì in un'atmosfera formale e poi informale per discutere di tutto. Altrimenti è scomodo farlo attraverso il forum.

Il programma sarebbe questo: un giorno conferenza, un giorno tutti bevono, il giorno dopo tutti litigano, si tirano le tette a vicenda, poi conferenza di nuovo e così via di seguito. Al volo :)

Lo sponsor e l'oratore principale sarebbero Saber, poi Alexei Nikolaev, poi tutti gli altri :)

Fourchette - non sembra male, ma il bisogno di violenza - beh, non l'ho notato personalmente. Mi rattrista il fatto di non essere compreso, ma questo non provoca di per sé una forte aggressività.

 
Aleksey Vyazmikin #:

Furshet - non sembra male, ma il bisogno di violenza - beh, non l'ho notato. Mi rattrista il fatto di non essere compreso, ma di per sé non è causa di una forte aggressività.

La violenza è solo consensuale e quando le discussioni sono finite, tutte le persone civilizzate
 
Maxim Dmitrievsky #:
Penso che dovremmo organizzare una conferenza sulle macchine. Dovrebbe includere un buffet e tenersi da qualche parte negli Emirati Arabi Uniti. E in un'atmosfera formale e poi informale per discutere di tutto. Altrimenti è scomodo farlo attraverso il forum.
Il programma sarebbe questo: un giorno conferenza, un giorno tutti bevono, il giorno dopo tutti litigano, si tirano le tette a vicenda, poi di nuovo conferenza e così via di seguito. Al volo :)
Lo sponsor e il relatore principale sarebbe Saber, poi Alexei Nikolaev, poi tutti gli altri :)

Volevo leggere qualcosa sull'apprendimento automatico, e qui gli umoristi stanno affinando le loro capacità.

Mi piacerebbe vedere battute umoristiche e altre cose non attinenti all'argomento altrove.


Passiamo ora all'argomento.

Lei scrive che pensa che il mercato sia casuale, su quali basi si basa questa affermazione?

Ha qualche base solida per dimostrare la casualità del movimento dei prezzi di mercato?