L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 82

 
mytarmailS:

Quando si addestra il modello, più alberi ci sono, più la classe "0" impara e come la classe "0" impara sempre di più, comincia a (assorbire - spremere) le classi "1" e "-1". Ecco perché più alberi e meno accordi

C'è qualcosa che non va, la foresta è quasi sempre addestrata al 100% di accuratezza con eventuali sbandamenti. Sulla convalida con tali dati ci possono essere problemi, ma prevedendo i risultati sui dati di allenamento la foresta sarà sempre accurata. Posso supporre che non state usando la classificazione ma la regressione, e quando testate il modello non ottenete classi nitide -1;0;1, ma numeri reali nell'intervallo da -1 a 1. Con questo tipo di regressione distorta, non ne verrà fuori niente di buono.

Un modo migliore per farlo è dire che avete una tabella trainingData, dove l'ultima colonna è la variabile obiettivo e tutte le altre colonne sono predittori:

trainingData <- data.frame(trainingData) #на  всякий случай сконвертировать таблицу из матрицы в датафрейм, если не было сделано раньше
trainingData[,ncol(trainingData)] <- factor(trainingData[,ncol(trainingData)]) #тип  последней колонки сменить на фактор. Модели в R обычно сразу по этому типу понимают что нужна классификация, и работают чуть иначе чем при регрессии
 
mytarmailS:

non proprio...

Quello che scrivo è applicabile solo al mio approccio.

sai come faccio il mio obiettivo, sono le inversioni

Ho tre classi di pivot ( 1 , -1 , 0 )

Sapete anche che l'asimmetria delle classi è enorme, la classe "0" è decine di volte più grande di "-1" e "1"

e questo significa che il modello è meglio addestrato sulla classe "0" perché ha il maggior numero di osservazioni e durante l'addestramento del modello, più alberi si addestrano più la classe "0" è addestrata e come la classe "0" diventa migliore e più forte inizia a (assorbire - spremere fuori) le classi "1", "-1 Ecco perché più alberi e meno accordi

Per me scrivi cose incredibili!

Un approccio molto originale per le classi sbilanciate.

Allora la mia comprensione è che la tua lista di predittori non solo non contiene rumore, ma ha anche un potere predittivo molto alto.

Se sì, come avete ottenuto questo risultato?

 
Dr.Trader:

C'è qualcosa che non va, la foresta è quasi sempre addestrata al 100% di precisione con qualsiasi bias. Sulla convalida ci possono essere problemi con tali dati, ma la foresta predirà sempre i risultati sui dati di addestramento in modo accurato. Posso supporre che non state usando la classificazione ma la regressione, e quando testate il modello non ottenete classi nitide -1;0;1, ma numeri reali nell'intervallo da -1 a 1. Con questo tipo di regressione distorta, non ne verrà fuori niente di buono.

Per fare meglio, diciamo che avete una tabella trainingData, dove l'ultima colonna è la variabile target e tutte le altre colonne sono predittori:

Il 100% per un albero è un'assurdità assoluta!

Se tutti i vostri predittori sono rumore, questo risultato è molto difficile da raggiungere: ci sarà ancora un errore del 3%-5%. Il rumore dà sempre ottimi risultati con tutte le convalide incrociate e altri trucchi.

Una precisione del 100% significa solo una cosa: tra i predittori avete un duplicato della variabile obiettivo (qualche modifica di essa). Cioè il modello guarda al futuro.

 
SanSanych Fomenko:


Il 100% di precisione significa solo una cosa: tra i predittori avete un duplicato della variabile obiettivo (qualche modifica di essa). Cioè, il modello guarda al futuro.

Questa è una fuga di dati. È necessario controllare di nuovo i dati.
 
Alexey Burnakov:

Cosa non ti piace di questo approccio? Come regolerete i parametri?

Sì, l'approccio è ottimo, è difficile pensare a qualcosa di meglio, il problema è nel mercato stesso...

Ricordate, vi ho parlato dei miei esperimenti, delle correlazioni e della ricerca di modelli nella storia (non SSA, ma prima), quello che ho fatto:

Ho preso la situazione attuale e ho cercato i suoi analoghi nel passato e ho guardato come sono finiti, se ho trovato una situazione "X", quando ho trovato 20 analoghi di cui 17 sono finiti con un calo e 3 con un aumento, quindi il vantaggio statistico è ovvio(dobbiamo vendere),a proposito, perché non è la validazione incrociata? Solo da un singolo modello, non sei d'accordo? Abbiamo scoperto che questo modello non funzionerà, abbiamo scoperto che con un'enorme percentuale di probabilità il mercato salirà, va contro le sue stesse statistiche con un'enorme probabilità statistica.

Per semplificare, se ieri abbiamo avuto l'evento "x" e dopo di esso abbiamo avuto la caduta e il giorno prima abbiamo avuto l'evento"x" e dopo di esso tutto è caduto anche lui e dopo ieri c'è stata una caduta dopo l'evento"x"- quindi se oggi abbiamo l' evento"x"- tutto crescerà, quale crosvalidazione ci aiuterà qui?Niente, mai.

La cosa più importante è capire il processo.

Il mercato è un business crudele, dove alcune persone che hanno costruito questo business prendono legalmente i soldi dagli altri. La folla, la maggioranza, è sempre obbligata a perdere, tutti lo sanno, tutti lo scrivono, nessuno lo nasconde, insomma, è un assioma - un modello del 95% dei trader che perde soldi - il mercato si muove contro la maggioranza con la probabilità che i trader perdano soldi con quel 95%.

E cosa usa la folla quando fa trading? In effetti, la folla non ha nulla oltre a una cosa che li fa fare accordi.

Tutte le azioni che partono dall'osservazione visiva dei grafici e dalla ricerca di pattern nella scomposizione e finiscono con l' addestramento delle reti neurali non sono altro che trading per statistica, proprio quella statistica che non funziona sul mercato, sapete di cosa sto parlando?

il mercato si muove contro gli scambi della folla ----- la folla agisce in base alle statistiche ------ tutto quello che devi fare è prevedere l'azione della folla in futuro e fare il contrario, l'unico modo per prevedere è la statistica

)))) iniziare con uno e finire con il terzo :) Beh, questo è tutto, almeno mi sono tolto il pensiero).

p.s. tutto quello che ho detto qui è la mia opinione personale, non voglio imporre nulla a nessuno, posso discutere e dimostrarlo, ma non sono in vena di farlo

 
Dr.Trader:

C'è qualcosa che non va, la foresta è quasi sempre addestrata al 100% di precisione con qualsiasi bias. Sulla convalida ci possono essere problemi con tali dati, ma la foresta predirà sempre i risultati sui dati di addestramento in modo accurato. Posso supporre che non state usando la classificazione ma la regressione, e quando testate il modello non ottenete classi nitide -1;0;1, ma numeri reali nell'intervallo da -1 a 1. Con una regressione così sbilanciata, non ne verrà fuori niente di buono.

È meglio avere una tabella trainingData dove l'ultima colonna è la variabile target e tutte le altre colonne sono predittori:

No, classificazione, hai qualcosa di sbagliato...

qqq

L'avevo così, due modelli, separatamente le classi di acquisto e vendita (1, 0) e (-1, 0)

sembra brutto ) sono d'accordo

 
mytarmailS:

Sì, l'approccio è ottimo, è difficile pensare a qualcosa di meglio, il problema è nel mercato stesso...

Ricordate che vi ho parlato dei miei esperimenti, delle correlazioni e della ricerca di modelli nella storia (non SSA, ma prima), quello che ho fatto:

Ho preso la situazione attuale e ho cercato i suoi analoghi nel passato e ho guardato come sono finiti, se ho trovato una situazione "X", quando ho trovato 20 analoghi di cui 17 sono finiti con un calo e 3 con un aumento, quindi il vantaggio statistico è ovvio(dobbiamo vendere),a proposito, perché non è la validazione incrociata? Solo da un singolo modello, non sei d'accordo? Abbiamo scoperto che questo modello non funzionerà, abbiamo scoperto che con un'enorme percentuale di probabilità il mercato salirà, va contro le sue stesse statistiche con un'enorme probabilità statistica.

Per semplificare, se ieri abbiamo avuto l'evento "x" e dopo di esso abbiamo avuto la caduta e il giorno prima abbiamo avuto l'evento"x" e dopo di esso tutto è caduto anche lui e dopo ieri c'è stata una caduta dopo l'evento"x"- quindi se oggi abbiamo l' evento"x"- tutto crescerà, quale crosvalidazione ci aiuterà qui?Niente, mai.

La cosa più importante è capire il processo.

Il mercato è un business crudele, dove alcune persone che hanno costruito questo business prendono legalmente i soldi dagli altri. La folla, la maggioranza, è sempre obbligata a perdere, tutti lo sanno, tutti lo scrivono, nessuno lo nasconde, insomma, è un assioma - un modello del 95% dei trader che perde soldi - il mercato si muove contro la maggioranza con la probabilità che i trader perdano soldi con quel 95%.

E cosa usa la folla quando fa trading? In effetti, la folla non ha nulla oltre a una cosa che li fa fare accordi.

Qualsiasi azione , dalla navigazione visiva dei grafici e la ricerca di schemi nelle rotture all' addestramento delle reti neurali, non è altro che trading per statistica, la stessa statistica che non funziona sul mercato, sapete di cosa sto parlando?

il mercato si muove contro gli scambi della folla ----- la folla agisce in base alle statistiche ------ tutto quello che devi fare è prevedere l'azione della folla in futuro e fare il contrario, l'unico modo per prevedere è la statistica

)))) iniziare con uno e finire con il terzo :) quindi questo è tutto, almeno mi sono tolto il pensiero).

p.s. tutto quello che ho detto qui è solo la mia opinione, nessuno sta imponendo nulla, posso argomentare e dimostrarlo, ma non l'umore

Ok.

Per quanto mi riguarda il Forex è un semplice segnale con rumori. Se trovo una dipendenza prendo i soldi, se mi riqualifico, il broker li toglie. E sulla folla, ecc. non ho informazioni. Non so come farne a meno.

Voglio iniziare ad occuparmi di quotazioni azionarie dopo aver finito questo esperimento. Lì otterrò dei volumi reali, il che è anche un vantaggio.

 
Alexey Burnakov:

OK.

Per me il forex è uno stupido segnale con rumore. Se trovo una dipendenza, prendo i soldi, se mi riqualifico, il broker prende i soldi. E sulla folla, ecc. non ho informazioni. Non so come farne a meno.

Voglio iniziare ad occuparmi di quotazioni azionarie dopo aver finito questo esperimento. Voglio usare citazioni reali.

Se fai trading di eurodollari sul forex devi capire cosa guida il tuo FX. Se fai trading sull'EURUSD sul CME, la folla reale muove le transazioni reali, e quello che hai nella trasmissione del terminale è solo un'immagine che ripete il movimento dell'EURUSD reale e niente di più, la tua transazione in MT4 non ha alcun impatto sul mercato, nessuno porta i tuoi 10 dollari (figurativamente) all'Interbank, fai trading con la tua casa di intermediazione e questo è tutto, piuttosto fa trading contro di te, perché la tua perdita è il suo profitto netto
 
Alexey Burnakov:

Dopo aver completato questo esperimento, voglio occuparmi delle quotazioni di borsa. Ci saranno volumi reali, il che è anche un vantaggio.

Ho sempre fatto trading solo sul mercato reale, so di cosa sto parlando.
 
mytarmailS:
Credetemi, il volume non vi aiuterà molto, potete sostituirlo con la volatilità regolare, ho quasi sempre fatto trading solo nel mercato reale, so di cosa sto parlando

Ok.

Cercherò di fare delle schede di input dal volume e poi vedremo.