L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1120

 
Non lo è:
Questo caso, e con il tuo set di dati... Scusa, ma molte persone ti hanno detto molte volte che hai bisogno di almeno migliaia di campioni, e data la rumorosità dei dati di mercato è preferibile che siano centinaia di migliaia di punti, ma quando imparerai Java e userai XGB per esempio, riderai della tua persistenza in passato))

questa è un'affermazione errata

 
Mihail Marchukajtes:

Così ho trovato una metrica migliorata per il coefficiente di Matthews, ma cosa posso dire se soffi di qua e di là non lo fai. :-(

Sono bloccato con il passaggio di un array da una classe all'altra, e diavolo... nessuno a cui chiedere :-(

Perché preoccuparsi delle metriche quando si hanno le proprie per TC? per esempio, si può misurare il fattore di profitto sui campioni e questo è tutto

e le stime interne del modello sono secondarie, perché l'errore più piccolo non significa la maggiore stabilità con nuovi dati

basta scegliere un criterio esterno di valutazione attraverso la performance del commercio sui nuovi dati

non hai un grande campione per il test, lecchi solo la vite... un piccolo campione per un vassoio non è critico, tutto va bene

 
È solo che il modello peserà un gigabyte:

Si potrebbe obiettare, ma nel mercato non si tratta affatto di fedeltà/non fedeltà, è più importante farlo funzionare, e con me di solito più campioni sono meglio è il risultato)))

basta prendere timber o xgb - a loro non importa quanti campioni reimparare :) è solo il modello peserà giga

ma l'enumerazione ricorsiva delle caratteristiche con metriche esterne ha iniziato a dare risultati anche su piccoli sottocampioni, e nemmeno le metriche esterne
 
Vizard_:

Trend = 100k linee. Sui restanti 8k+(test) si applica il modello. I dati vengono mischiati.
La metrica è logloss. Risultato, pubblicatelo. Tendenza =... test =...

Questo non viene fatto con le serie temporali, ovviamente. Ma per interesse, l'ho messo in LightGBM quasi di default senza toccare affatto i dati:

Treno: 0.6879388421499111

Test: 0.6915181677127092


Fonti di prova, bonus con CatBoost:

https://yadi.sk/d/55DDn-hViNWP6Q


Quali sono i vostri risultati?

test_xz.ipynb
test_xz.ipynb
  • disk.yandex.ru
Посмотреть и скачать с Яндекс.Диска
 
Maxim Dmitrievsky:

Perché preoccuparsi delle metriche quando il TS ha le sue metriche? per esempio, misurare il fattore di profitto sui campioni ed è tutto

la stima interna del modello è secondaria, perché l'errore più piccolo non significa la maggiore stabilità con nuovi dati

basta scegliere un criterio esterno di valutazione attraverso la performance del commercio sui nuovi dati

non hai un grande campione per il test che leccherai la vite ... e un piccolo campione per un vassoio non è critico, tutto va bene

Ci dovrebbe essere una quantità illimitata di spazio per il test in generale.

Se qualcuno vuole controllare la qualità dei suoi dati, dovrebbe metterli non sotto forma di qualche oscuro file CSV, ma sotto forma di indicatori.

È possibile utilizzare un modello, anche se non c'è bisogno di segnare gli obiettivi, è chiaro che devono essere redditizi.

Poi possiamo insegnare qualsiasi modello, creare un Expert Advisor e testarlo oggettivamente insieme all'indicatore iniziale.

Beh, questo è se vuoi fare qualcosa, ma se vuoi solo parlare...

 
È un po' più complicato, ma probabilmente ti risparmierà unsacco di problemi:

Più rumore, più campioni, dovrebbe essere chiaro a livello di statistica elementare, e i dati di mercato sono molto rumorosi, la riqualificazione è un altro problema, se si insegnano le caratteristiche correttamente costruite e il targeting corretto poi su un test con decine o centinaia di migliaia di campioni, la riqualificazione è davvero difficile da ottenere. Questa è la cosa buona dei grandi set di dati, sono difficili da riqualificare, a meno che il datascientist o l'algotrader siano mazahisti o quasi-marketers e mescolino gli obiettivi con le caratteristiche. Ragione ovvia per preoccuparsi - il chip correla con l'obiettivo per più del 3-5%, quindi deve sbirciare, e meglio costruire le fiche in modo che non ci sia una tale possibilità in linea di principio, complicherà un po' gli algoritmi, ma probabilmente si libererà di Il principale errore che fanno gli algotraders principianti.

Tutti voi state rimproverando i trader di quasi-mercato, io lo sono, ma voi sembrate essere freddi, algotrader di mercato e, a giudicare dai vostri post, sapete quale periodo insegnare e su quale fare trading.

Ma non lo so e quando ho visto la discussione ieri non mi sono fatto coinvolgere e ho deciso solo di provare, così ho allenato la demo su EURUSD M1 dall'8 al 18 di ottobre, tutto il tempo che avevo presso il mio broker e ho eseguito l'EA in tempo reale.

Quindi commercia in profitto finora, ma la domanda per te, come esperto, è quando inizierà a perdere, login - 2096584180, password - na3tbvr, Tradize-Demo, ma in particolare, non sulle astronavi che si aggirano nella vasta distesa del grande teatro (c)).


 
Ho un tester di trading in tempo reale МТ4, neuronet:

Il campione di apprendimento è minuscolo, la logica del tester e dell'ottimizzatore non è trasparente (scatola nera)...

Conclusione - 99.9999999999999% che questo EA è casuale, l'equità è un vagabondaggio geometrico casuale con una pendenza verso il basso a causa dei costi di scambio.

A seconda della frequenza degli scambi, posso solo vang negativo SR<-0.5 per l'anno

1. C'è il trading in tempo reale, MT4 tester, rete neurale.

2. la risposta è sbagliata al 100% - l'Expert Advisor non è casuale.

3. addestrato in 8 giorni di dati di trading, ma previsioni per un anno...?:)


ZS: Ho chiesto specificamente, per esempio - il rapporto tra il periodo di trading e il periodo di formazione al 30% e il consulente inizierà a perdere dopodomani, o il 10% - oggi, ma poiché la scienza tace...

 
Non lo so:

Conclusione - 99.99999999999% che questo EA è casuale, l'equità è casuale geometrica errante con una pendenza verso il basso a causa dei costi di scambio.

hmm, questa è la mia foto, cosa ci vedi?

;)

 
Non lo so:

casuale ti dico

Direi anche che non può essere perché non può mai essere. (c) E non è realistico allenarsi su 50 trade, ma abbiamo bisogno di guardare altri 30-40 trade (cioè 3-4 giorni) per trarre conclusioni. Se li vediamo, ovviamente.

Ma, in generale, è già strano.

 
Vi dicoche questa è la sua corsa nel tester - e questo è casuale?

Casuale, ve lo dico io.

Ecco la sua corsa da tester - e tu lo chiami casuale?

File: