L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1383

 
elibrario:

Non applico la divisione (P[i] / P[0]), ma la sottrazione (P[i] - P[0]), cioè non il cambiamento di prezzo relativo, ma assoluto. Elimino preliminarmente gli outlier (1% in quantità dai valori più grandi e più piccoli).

La divisione dà qualche vantaggio? Attualmente sto usando una foresta che non richiede la normalizzazione e il ridimensionamento.

Si fa lo spostamento ma non il ridimensionamento
 
Yuriy Asaulenko:
State facendo uno spostamento, ma non un ridimensionamento.
Sì. Anche gli alberi/le foreste non hanno bisogno di essere ridimensionati.


Cioè non c'è molto vantaggio nel dividere rispetto al sottrarre. Tranne nel caso del logaritmo, che renderà i dati più simili a una distribuzione normale, come ha detto Alexey Nikolaev. Cioè la densità tra i punti cambierà, ma non l'ordine. Ma in questo caso non vedo nemmeno vantaggi - l'albero farà le suddivisioni non per un livello, ma per un altro - cioè si adatterà a qualsiasi distribuzione. Poiché l'albero è essenzialmente una semplice memorizzazione.

 
Prendi il prezzo come percentuale degli ultimi 100 prezzi. sbagliato?
 
Evgeniy Chumakov:
Prendi il prezzo come percentuale degli ultimi 100 prezzi. sbagliato?
Questo è simile alla divisione
 

Il grafico dovrebbe essere diviso in livelli, pezzi identici o non identici verticalmente, e ogni pezzo dovrebbe essere nomrrmmato in un intervallo.

Il grafico dovrebbe essere diviso in livelli, pezzi uguali o forse non uguali verticalmente, e ogni pezzo dovrebbe essere normalizzato in un range, cioè analogo ai normali livelli di prezzo. Se non normalizziamo l'intera serie o nella finestra scorrevole, perderemo di nuovo alcune informazioni molto importanti.

Ma quando si divide in livelli ci troviamo di fronte a un altro problema - quando il prezzo è nelle condizioni limite o se prendiamo molti prezzi recenti per la formazione, alcuni di essi sono su un "livello", gli altri sono su un altro. Non ho ancora capito come farlo.

Potrei aver bisogno di specchiare i livelli l'uno rispetto all'altro per rendere le transizioni tra loro indolori

è naturale che il grafico non convertito sia ancora il più informativo. Perciò dovete stare molto attenti a qualsiasi conversione - la qualità del modello si degraderà in proporzione alla vostra ignoranza. Da qui tutte le storie sul fatto che il 50% di errore è normale e altre sciocchezze, il modello semplicemente non impara nulla da tali "caratteristiche".

 

È qualcosa di complicato, non so perché e non so davvero come fare.

Yuri sta facendo bene anche con semplici incrementi

 

x.append((SD.history[i-j][c.c]/SD.history[i][c.c]-1)*1000)

questo non ha senso - ogni catena calda successiva contiene la metà delle informazioni utili di quella precedente, cioè essi, 1: fortemente correlati, 2: la catena calda con il maggior ritardo contiene tutta la varianza della catena calda precedente, cioè non danno alcun incremento di informazione

il risultato sarà il seguente: l'importanza del rendimento con il maggior ritardo sarà la più grande (più varianza, più guadagno di informazioni), e questo rendimento contiene tutta la varianza delle altre caratteristiche

 
elibrario:

Yuri se la cava bene anche con gli incrementi semplici.

non può essere perché non può mai essere

 
elibrario:

Qualcosa che hai inventato è complicato, non è chiaro perché e non è chiaro come farlo.

immaginare la situazione.

Il prezzo nel mercato riflette l'equilibrio della domanda e dell'offerta soprattutto, in diversi momenti storici

Lei si attacca a una sezione limitata e normalizzata della storia come caratteristica, che riflette solo la situazione attuale

il vostro modello fonde diversi momenti storici in un flusso normalizzato impersonale (tutte le situazioni di mercato sono equiparate tra loro), che non contiene più alcuna sequenza storica o un prezzo equo

Si rimane con un mucchio di pattern normalizzati identici, che si sovrappongono quando si aumenta la profondità della storia, portando ad un errore del 50/50. Non si insegna nulla al modello e si buttano via le informazioni più importanti già durante il preprocessing, perché si fa tutto in modo sbagliato, cioè seguendo libri, progettati per compiti assolutamente diversi e che descrivono processi completamente diversi.

Una citazione non è un segnale, è un processo completamente diverso e non dovrebbe essere gestito in questo modo. Yuri è un radiofisico, per esempio, e quindi non ha altro da fare.

In questo tipo di formazione, si tiene conto del tempo, ma non del prezzo. Il livello dei prezzi (sopra/sotto) nel mercato è ancora più importante del tempo perché riflette l'equilibrio tra domanda e offerta, che riflette tutte le informazioni di base del mercato.
 
Maxim Dmitrievsky:

immaginare la situazione.

Il prezzo sul mercato riflette l'equilibrio della domanda e dell'offerta, per lo più in diversi momenti storici

Lei si attiene a una sezione limitata e normalizzata della storia come caratteristica, che riflette solo la situazione attuale

il vostro modello fonde diversi momenti storici in un flusso normalizzato impersonale (tutte le situazioni di mercato sono equiparate tra loro), che non contiene più alcuna sequenza storica o un prezzo equo

Si rimane con un mucchio di pattern normalizzati identici, che si sovrappongono quando si aumenta la profondità della storia, portando ad un errore del 50/50. Non si insegna nulla al modello e si buttano via le informazioni più importanti già durante il preprocessing, perché si fa tutto in modo sbagliato, cioè seguendo libri, progettati per compiti assolutamente diversi e che descrivono processi completamente diversi.

Una citazione non è un segnale, è un processo completamente diverso e non dovrebbe essere gestito in questo modo. Yuri è un radiofisico, per esempio, e quindi non ha altro da fare.

In questo tipo di formazione, si considera il tempo, ma non il prezzo. Il livello dei prezzi (sopra/sotto) nel mercato è ancora più importante del tempo perché riflette l'equilibrio tra domanda e offerta, che riflette tutte le informazioni di base del mercato.

È un peccato che non si possa dare un "Like".