L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 804

 
Yuriy Asaulenko:

Non essere triste, ne sono consapevole). Anche se, se vi sentite più a vostro agio, potete continuare.

Ma hai ragione.

 
Aleksey Vyazmikin:
Per favore ditemi, è sufficiente cercare la correlazione con i dati target nella fase iniziale, se sì, quale soglia di correlazione dovrebbe essere usata?
La correlazione è un metodo lineare. Se c'è, non ha senso fare un orto con NS. La regressione lineare è sufficiente.
 
Grigoriy Chaunin:
La correlazione è un metodo lineare. Se è presente, non ha senso fare un orto con NS. La regressione lineare è sufficiente.

Grazie per la sua risposta.

Che ne dite di applicare la regressione lineare per identificare le relazioni più solide, aggiungendo ulteriori caratteristiche?

 
Non capisco la domanda. Tuttavia, la regressione lineare non funziona nei mercati finanziari.
 

È da un po' che ci penso.... in realtà.

Abbiamo una matrice dieci per dieci, cosa possiamo dire?

La quantità di dati è 100.

Poi possiamo calcolare la quantità di informazioni in questi dati che saranno anche espressi in alcune unità. Cos'altro contiene questo set di dati, oltre alla quantità di dati e alla quantità di informazioni???? Non ho intenzione di perdere tempo a rispondere. La quantità di conoscenza. Tutto questo è naturale in relazione all'obiettivo. Quindi, se guardiamo la relazione causa-effetto, otteniamo il seguente modello.

Quantità di conoscenza -> Quantità di dati -> Quantità di informazioni.

Quindi per prevedere è necessario trovare solo la CONOSCENZA di un valore richiesto da un insieme di dati, invece della quantità di informazioni.

La conoscenza stessa è una cosa molto fragile che può essere persa da una conversione di dati non competente. Un cambiamento incauto, anche in un record di una piccola quantità, può ridurre significativamente l'importo se non rimuoverlo completamente.

Ecco perché non è consigliabile rendere i dati di input più complessi con le conversioni. Più la trasformazione è complessa, meno conoscenza rimane nel risultato finale.

Quindi... Solo pensando ad alta voce sulla materia alta, alcune persone non lo capiranno e continueranno la loro strada senza raggiungere la stazione finale....

 
Mihail Marchukajtes:

È da un po' che ci penso.... in realtà.

Abbiamo una matrice dieci per dieci, cosa possiamo dire?

La quantità di dati è 100.

Poi possiamo calcolare la quantità di informazioni in questi dati che saranno anche espressi in alcune unità. Cos'altro contiene questo set di dati, oltre alla quantità di dati e alla quantità di informazioni???? Non perderò tempo a rispondere. La quantità di conoscenza. Tutto questo è naturale in relazione all'obiettivo. Quindi, se guardiamo la relazione causa-effetto, otteniamo il seguente modello.

Quantità di conoscenza -> Quantità di dati -> Quantità di informazioni.

Quindi per prevedere è necessario trovare solo la CONOSCENZA di un valore richiesto da un insieme di dati, invece della quantità di informazioni.

La conoscenza stessa è una cosa molto fragile che può essere persa da una conversione di dati non competente. Un cambiamento incauto, anche in una registrazione di una piccola quantità, può ridurre significativamente l'importo, se non eliminarlo completamente.

Ecco perché non è consigliabile rendere i dati di input più complessi con le conversioni. Più la trasformazione è complessa, meno conoscenza rimane nel risultato finale.

Quindi... Solo pensando ad alta voce alla materia, alcune persone non lo capiranno e continueranno il loro cammino senza raggiungere la stazione finale....

Per di più, hai pensato e arrotondato i numeri a decine e hai perso alcuni dati, è generalmente dannoso pensare, e alcune persone continuano...

 
Aleksey Vyazmikin:

Grazie per la sua risposta.

Che ne dite di applicare la regressione lineare per identificare le relazioni più solide, aggiungendo ulteriori caratteristiche?

https://www.mql5.com/ru/articles/349

Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
  • 2011.12.07
  • ArtemGaleev
  • www.mql5.com
Один мой знакомый, посещая учебные курсы о торговле на форекс, получил домашнее задание - построить торговую систему. Повозившись с этим с недельку, он сказал, что эта задача, пожалуй, сложнее, чем написать диссертацию. Тогда я предложил ему попробовать множественный регрессионный анализ. В итоге за вечер была создана "с нуля" торговая система...
 
Grigoriy Chaunin:
Non capisco la domanda, ma la regressione lineare non funziona nei mercati finanziari.

Quindi non c'è correlazione? Credo cheMaxim Dmitrievsky abbia risposto alla domanda qui sotto.

Grazie per la risposta.

 
Provate a tracciare la correzione automatica sui dati dei prezzi e vedrete immediatamente se c'è correlazione o no. Aggiungere indicatori è inutile. L'indicatore è una funzione del prezzo. Perciò lo costruiamo solo su dati di prezzo.
 

Per gli appassionati di convalida incrociata, campionamento di test, OOS e altre cose, non mi stancherò di ripetermi:

SanSanych e Vladimir Perervenko in particolare

Test fuori campione
Questo è il metodo di convalida più popolare e anche abusato. In breve, i test fuori campione richiedono di mettere da parte una parte dei dati da utilizzare per testare la strategia dopo che è stata sviluppata e ottenere una stima imparziale della performance futura. Tuttavia, i test fuori campione
ridurre la potenza dei test a causa di un campione più piccolo
i risultati sono distorti se la strategia è sviluppata attraverso confronti multipli
In altre parole, i test out-of-sample sono utili solo nel caso di ipotesi uniche. L'uso di test fuori campione per le strategie sviluppate attraverso il data-mining mostra la mancanza di comprensione del processo. In questo caso il test può essere usato per rifiutare strategie ma non per accettarne nessuna. In questo senso, il test è ancora utile, ma gli sviluppatori di strategie di trading sanno che una buona performance fuori dal campione per le strategie sviluppate tramite confronti multipli è nella maggior parte dei casi un risultato casuale.
Sono stati proposti alcuni metodi per correggere la significatività out-of-sample per la presenza di bias da confronti multipli, ma in quasi tutti i casi reali il risultato è una strategia non significativa. Tuttavia, come mostriamo in Rif. 1 con due esempi che corrispondono a due importanti regimi di mercato, le strategie altamente significative anche dopo l'applicazione delle correzioni per i bias possono fallire a causa del cambiamento dei mercati. Pertanto, i test fuori campione sono stime imparziali della performance futura solo se i rendimenti futuri sono distribuiti in modo identico ai rendimenti passati. In altre parole, la non stazionarietà può invalidare qualsiasi risultato dei test fuori campione.


Conclusione: i test fuori campione si applicano solo a ipotesi uniche e presuppongono la stazionarietà. In questo caso sono utili, ma se queste condizioni non sono soddisfatte, possono essere abbastanza fuorvianti.

Il ROS può essere usato solo per la cancellazione di ipotesi o solo per problemi stazionari noti.

Ma non per le strategie di ricerca e la selezione delle caratteristiche/valutazione della stabilità del sistema