English Русский 中文 Español Deutsch 日本語 Português 한국어 Français Türkçe
Analisi dei parametri statistici degli indicatori

Analisi dei parametri statistici degli indicatori

MetaTrader 5Statistiche e analisi | 17 dicembre 2021, 15:54
187 0
СанСаныч Фоменко
СанСаныч Фоменко

Introduzione

I trader utilizzano ampiamente gli indicatori, i quali mostrano le quotazioni di base "più chiaramente" consentendo loro di eseguire analisi e prevedere il movimento dei prezzi di mercato. Le questioni relative alla validità della trasformazione e alla credibilità dei risultati ottenuti non vengono solitamente prese in considerazione e, nella migliore delle ipotesi, sostituite con la verifica dei sistemi di negoziazione sulla base degli indicatori.

Per me è abbastanza ovvio che non ha senso utilizzare gli indicatori, figuriamoci applicarli nella creazione di sistemi di trading. A meno che non si risolvano i problemi relativi alla trasformazione delle quotazioni iniziali e alla credibilità dei risultati ottenuti. In questo articolo mostriamo che ci sono serie ragioni per una tale conclusione. Prenderemo in considerazione potenziali problemi utilizzando tre indicatori: linea di tendenza retta, media mobile esponenziale e filtro di Hodrick-Prescott.


1. Un po' di teoria

Per comodità dei lettori, menzionerò alcuni termini della teoria della probabilità e della statistica matematica che verranno utilizzati più avanti. Non fornirò collegamenti, poiché i termini applicati qui sono completamente equivalenti a quelli corrispondenti utilizzati nei libri di testo.

1.1. La descrizione probabilistica delle osservazioni economiche

Le quotazioni che osserviamo sono misurazioni selettive indirette (la popolazione generale ci è sconosciuta) di alcuni processi stocastici a livello fondamentale tra cui:

  • componenti deterministici accuratamente misurati, ad esempio operazioni di acquisto o vendita di valuta eseguite;
  • componenti deterministiche misurate con un errore, come la quantità di valuta venduta in un intervallo di tempo, ad esempio in un giorno;
  • componente stocastica, che non può essere misurata, come l'umore della folla. Per la maggior parte del tempo, la caratteristica principale di questo componente è un movimento casuale con una deriva.

L'interazione di questi componenti si traduce in un processo stocastico che include:

  • trend (deterministico e stocastico);
  • cicli con durata dei periodi fissa e stocastica;
  • movimento casuale con una deriva.

La non stazionarietà è una caratteristica comune di un processo stocastico che si riflette nelle quotazioni valutarie. Il concetto di processo stocastico non stazionario è importante per noi solo perché non fornisce quasi alcun mezzo per la sua analisi, quindi deve essere suddiviso in un insieme di processi separati che è possibile analizzare. Quando si applicano gli indicatori, un trader non pensa all'applicabilità dell'indicatore a una quotazione di un simbolo specifico. Tuttavia, esistono strumenti di econometria che consentono di valutare la possibilità di applicare un indicatore e il risultato di tale applicazione.


1.2. Evento casuale. Probabilità

Un evento casuale (l'acquisto e la vendita di valuta, nel nostro caso) è un evento che può verificarsi o meno. Sappiamo che il numero di offerte in giorni diversi e in orari diversi di una giornata è differente e, di fatto, è un valore casuale, ma solo gli eventi in momenti discreti (come minuto, ora, giorno, ecc.) sono presi in considerazione più comunemente.

La frequenza relativa di un evento casuale è il rapporto tra un numero di occorrenze di tale evento M e il numero generale di osservazioni compiute N. Al crescere del numero di osservazioni (in teoria, fino all'infinito) la frequenza tende al numero chiamata probabilità di eventi casuali. Per definizione, la probabilità è un valore da zero a uno. Il termine "probabilità" verrà solitamente utilizzato in questo articolo al posto della frequenza relativa.

Il valore casuale è una quantità che assume valori diversi con determinate probabilità.

L'insieme generale indica tutti i possibili valori che può assumere quello casuale. Ci occupiamo sempre di un campione dell'insieme generale del mercato, solitamente utilizzando le quotazioni per un certo periodo di tempo. È del tutto naturale che le statistiche ottenute utilizzando un campione differiscano dalle statistiche calcolate sull'insieme generale, poiché la frequenza relativa differisce dalla probabilità. Ulteriori calcoli vengono effettuati per valutare le differenze tra le statistiche ottenute utilizzando un campione e quella calcolata sull'insieme generale. Tale approccio è impossibile nel caso degli indicatori, poiché i prezzi, ad esempio un prezzo vicino, sono considerati valori deterministici da un indicatore durante i calcoli.

Un'altra osservazione interessante. Poiché stiamo cercando di osservare l'insieme generale, possiamo ignorare le differenze nelle quotazioni presentate dai diversi centri di negoziazione, poiché è facile modificare i valori delle quotazioni ma è molto difficile modificare le loro proprietà statistiche.


1.3. Caratteristiche delle variabili casuali

1.3.1. Statistiche descrittive

Gli insiemi di quantità casuali (quotazioni valutarie, nel nostro caso) sono caratterizzati da una serie di parametri. Alcuni di questi parametri verranno utilizzati più avanti.

L'istogramma è un grafico che mostra la frequenza del valore casuale. Nel suo caso estremo è un grafico che mostra la densità della distribuzione di probabilità.

La media aritmetica (media) è la somma di tutti i valori delle osservazioni divisa per il numero di osservazioni (il numero di periodi nel nostro caso). Non è applicabile per tutte le distribuzioni e più popolare per quelle normali quando coincide con la mediana. A rigor di termini, ciò implica che l'indicatore di media mobile più popolare può essere applicato nel caso in cui le quotazioni abbiano la legge di distribuzione, per la quale esiste il valore medio.

La mediana divide tutte le osservazioni in un campione in due parti: nel primo caso tutte le osservazioni sono inferiori al valore mediano, nel secondo i valori delle osservazioni superano il valore mediano. La mediana esiste per qualsiasi distribuzione e non è sensibile ai valori anomali. Nel caso in cui la media sia uguale (o vicina) alla mediana, è una delle normali caratteristiche della legge di distribuzione.

La deviazione dalla media è una domanda piuttosto interessante. La dispersione è un valore medio dei quadrati di deviazione di un valore casuale dalla sua aspettativa matematica. La radice quadrata della dispersione è una deviazione quadratica media (standard).

La deviazione standard e la dispersione non sono resistenti ai valori anomali.

Una quantità adimensionale chiamata rapporto di asimmetria serve come indicatore di un grado di asimmetria della curva della densità di distribuzione. Se il valore di asimmetria è minore di «sei diviso per il numero di osservazioni», la distribuzione della probabilità di un valore casuale dipende dalla legge normale.

Un altro valore che caratterizza la densità di distribuzione è la curtosi. È uguale a 3 in condizioni normali. Nel caso in cui la curtosi sia superiore a tre, la parte superiore è affilata e le code «pesanti» cadono ad angolo basso.

Come possiamo vedere, molti concetti sono applicabili a variabili casuali aventi la normale legge di distribuzione. Non è poi così male, poiché un gran numero di leggi di distribuzione si riduce a quello normale quando il numero di osservazioni aumenta.

1.3.2. Distribuzione normale

La distribuzione normale (gaussiana) è un caso estremo di quasi tutte le distribuzioni di probabilità reali.

Il teorema del limite di Lyapunov serve come base teorica affermando che la distribuzione di somme di valori casuali indipendenti aventi qualsiasi distribuzione iniziale sarà normale nel caso in cui si perdano osservazioni e il loro contributo sia piccolo. Pertanto, è ampiamente utilizzato in molte applicazioni del mondo reale della teoria della probabilità.

La distribuzione normale è una curva simmetrica a campana, la quale si estende su tutto l'asse dei numeri. La distribuzione gaussiana dipende da due parametri: μ (aspettativa matematica) e σ (deviazione standard).

L'aspettativa matematica e la mediana della distribuzione data sono uguali a μ, mentre la dispersione è uguale a σ2. La curva della densità di probabilità è simmetrica all'aspettativa matematica. Il rapporto di asimmetria e l'eccesso sono γ = 0, ε = 3.

La densità di distribuzione normale è spesso descritta non come funzione variabile x, ma come funzione variabile z = (x − μ) / σ avente aspettativa matematica zero e dispersione uguale a 1.

La distribuzione con μ = 0 e σ = 1 è chiamata distribuzione normale standard (iii).

Fig.1. Distribuzione normale

Fig.1. Distribuzione normale

1.3.3. Distribuzione di Student (distribuzione t)

Il parametro principale è il grado di libertà (il numero di elementi nel campione). All'aumentare del numero dei gradi di libertà, la distribuzione di Student si avvicina a quella normale standardizzata e, nel caso n > 30, la distribuzione di Student può essere sostituita con la distribuzione normale. Nel caso n < 30, la distribuzione di Student ha code più pesanti.

Fig.2. Distribuzione di Student

Fig.2. Distribuzione di Student

La statistica t è ampiamente utilizzata per testare ipotesi statistiche.

1.3.4. Chi-quadrato (distribuzione di Pearson)

Nel caso in cui Хi siano valori casuali indipendenti aventi i.i.i., allora la somma dei loro quadrati è soggetta a χ2-distribuzione. La densità dipende da un singolo parametro (di solito chiamato numero di gradi di libertà) uguale al numero di variabili casuali indipendenti. Se il numero di gradi di libertà ν →∞, χ2-distribuzione tende alla distribuzione normale avente centro v e dispersione 2ν. La densità di distribuzione è asimmetrica, unimodale e diventa anche più piatta e simmetrica all'aumentare dei gradi di libertà.

Fig.3. Distribuzione di Pearson (chi-quadrato)

Fig.3. Distribuzione di Pearson (chi quadrato)

1.3.5. Distribuzione F di Fisher

La distribuzione F di Fisher è una distribuzione di una relazione di dispersione, cioè il rapporto tra due serie di dispersioni.

Se due variabili casuali indipendenti hanno una distribuzione chi-quadrato con gradi di libertà (V1, V2), il loro rapporto ha distribuzione di Fisher.

Fig.4. Distribuzione di Fisher

Fig.4. Distribuzione di Fisher


1.3.6. Rapporto di determinazione R-quadrato

Il rapporto di determinazione mostra quale proporzione della dispersione dei risultati è spiegata dall'influenza delle variabili indipendenti. Nel caso di due variabili questo è il quadrato di correlazione di Pearson. Mostra la quantità di dispersione totale tra le due variabili.

La significatività del rapporto di correlazione dipende dal numero di osservazioni o dalla statistica F di Fisher. Quando il numero di candelieri in una quotazione supera 100, anche scostamenti molto piccoli dei valori osservati da zero sono sufficienti per confermare la significatività dell'indicatore.

1.4. Determinare le ipotesi

Quali conclusioni possiamo trarre su alcuni parametri generali impostati nel caso in cui abbiamo un valore selettivo di questo parametro? La risposta a questa domanda dipende dal fatto che disponiamo di alcune informazioni preliminari sulla dimensione del parametro generale.

Se l'informazione precedente sulla grandezza generale del parametro è assente, possiamo valutare questo parametro con un valore selettivo, impostando l'intervallo di fiducia per esso, cioè l'intervallo all'interno del quale si trova il suo valore con una certa probabilità sicura.

In pratica, di solito abbiamo bisogno di verificare alcune ipotesi specifiche e nella maggior parte dei casi semplici But. Questa ipotesi è considerata nulla. Per testare l'ipotesi, vengono utilizzati alcuni criteri che consentono di accettarla o rifiutarla. I tipi di statistiche elencati di seguito sono più spesso utilizzati come criteri: statistica t, statistica F e statistica chi-quadrato. Quando si utilizza un software specifico per la statistica (ad esempio STATISTICA) o l'econometria (come EViews), il criterio calcolato è accompagnato dal valore di significatività di questo criterio - valore p. Ad esempio, il valore p di 0,02 (2%) significa che il criterio corrispondente non è significativo al livello di significatività dell'1% e significativo al livello di significatività del 5%. Equivalentemente, si può assumere che l'ipotesi nulla non sia valida con la probabilità uguale a "1 - valore p".

La selezione di un valore p è soggettiva e determinata dalla gravità delle conseguenze di una valutazione errata di un criterio specifico.


1.5. Caratteristiche statistiche delle quotazioni

1.5.1. Statistiche descrittive

Le statistiche descrittive includono:

  • Un istogramma che deve avvicinarsi alla legge di distribuzione quando aumenta la quantità di candele in una quotazione;
  • Principali misure di tendenza: media, mediana;
  • Misura della dispersione: deviazione standard;
  • Misure di forma: asimmetria e curtosi;
  • Criterio di normalità di Jarque-Bera.

Criterio di Jarque-Bera. Ipotesi nulla But: la distribuzione è normale. Ad esempio, la probabilità che accompagna il valore del criterio è pari a 0,04. Sembra che si possa trarre la seguente conclusione: la probabilità di accettazione dell'ipotesi nulla è pari al 4%. Tuttavia, ciò non è del tutto corretto poiché il valore calcolato è un criterio di valore p e la probabilità di accettazione dell'ipotesi nulla è pari al 96%.


1.5.2. Autocorrelazione e statistica Q

La correlazione è una misura della relazione tra due variabili. Il rapporto di correlazione può variare da -1,00 a +1,00. Il valore -1,00 significa correlazione completamente negativa, il valore +1,00 significa correlazione completamente positiva. Il valore 0,00 indica l'assenza della correlazione.

La correlazione tra gli elementi di una citazione si chiama autocorrelazione. Può essere molto utile per trovare le tendenze. La presenza dell'autocorrelazione mette in discussione qualsiasi conclusione sulle quotazioni come variabili casuali, perché il fattore più significativo nella determinazione di un valore casuale è l'indipendenza di vari prezzi in diversi periodi di tempo.

Nel software di analisi statistica l'autocorrelazione è accompagnata dalla statistica Q di Ljung-Box con il valore p. L'ipotesi nulla è: l'autocorrelazione è assente cioè, nel caso in cui il valore p sia uguale a zero, si può concludere che la correlazione è assente prima di qualche candela definita in una quotazione.

L'esclusione delle autocorrelazioni (trend) dalle quotazioni è il primo passo per avere la possibilità di utilizzare i metodi della statistica matematica.


1.5.3. Quotazioni di stazionarietà

Considereremo le quotazioni stazionarie nel caso in cui la loro aspettativa matematica e dispersione non dipenda dal tempo. Anche questa definizione di stazionarietà è troppo rigida e poco adatta all'applicazione pratica. Le quotazioni sono molto spesso considerate stazionarie nel caso in cui le deviazioni dell'aspettativa matematica e/o la dispersione comprendano diverse percentuali (di solito non più del 5%) entro un certo tempo.

Le quotazioni effettive nel mercato Forex non sono stazionarie. Hanno le seguenti deviazioni:

  • La presenza di un trend generato dalla dipendenza tra le osservazioni nel tempo. La dipendenza è una caratteristica comune delle quotazioni delle valute e delle osservazioni economiche;
  • Ciclicità;
  • Dispersione variabile (eteroschedasticità).

Le quotazioni che si discostano da quelle stazionarie sono chiamate non stazionarie. Vengono analizzati dalla successiva scomposizione in componenti. Il processo di scomposizione termina al ricevimento del saldo di una serie stazionaria con attesa e/o dispersione pressoché costante.

Esistono diversi test per la stazionarietà delle quotazioni. Quelli di base sono i test di radice unitaria. Il più famoso dei test di radice unitaria è il test Dickey-Fuller. L'ipotesi nulla But: le virgolette non sono stazionarie (hanno una radice unitaria), cioè la media e la dispersione dipendono dal tempo. Poiché esiste una dipendenza dal tempo pressoché costante (un trend), la presenza di un trend nelle quotazioni deve essere indicata durante l'esecuzione del test. In questa fase sono determinati a occhio.


1.6.  Specifica degli indicatori (regressione)

Uno sguardo superficiale ai testi degli indicatori scritti usando linguaggi come MQL5, ad esempio, permette di identificare due forme della loro impostazione: analitica (più comune) e tabulare (applicata agli indicatori, chiamati filtri, ad esempio gli indicatori di Kravchuk) .

Ma useremo il termine 'regressione', un termine comune nelle statistiche matematiche e nell'econometria.

Avendo l'idea di cosa vogliamo ottenere dalle virgolette, dobbiamo impostare i seguenti parametri per formulare la regressione (indicatore):

  • L'elenco delle variabili indipendenti utilizzate per il calcolo dell'indicatore;
  • Rapporti variabili indipendenti;
  • Equazione di calcolo dell'indicatore che verrà utilizzata per il calcolo della variabile dipendente.

Mentre ci sono alcune difficoltà nella creazione di indicatori multivaluta, non ci sono tali difficoltà nella regressione.

Avendo queste tre posizioni, sarà necessario adattare la regressione a una quotazione. Contrariamente ai forum dei trader, la parola «fit, fitting» non è impropria in econometria, ma anzi è la procedura standard, durante la quale viene calcolata la conformità della regressione (indicatore) alle quotazioni utilizzando uno dei metodi di valutazione multipli. I minimi quadrati ordinari (OLS) sono il metodo di valutazione più noto.

La valutazione rivela due punti di interesse:

  • Conformità dell'indicatore con le quotazioni – il valore dell'errore residuo;
  • Stabilità dei parametri di regressione calcolati in futuro.

Le risposte a queste domande vengono fornite durante la diagnostica degli indicatori.


1.7. Indicatori Diagnostica

La diagnostica degli indicatori (regressioni) è suddivisa in tre gruppi:

  • Diagnostica dei rapporti;
  • Diagnostica residui;
  • Diagnostica di stabilità.

Ogni procedura di verifica descritta di seguito include la specifica dell'ipotesi nulla utilizzata come ipotesi di verifica. Il risultato della verifica consiste nella selezione dei valori di una o più statistiche e dei relativi valori p. Questi ultimi indicano la probabilità di esecuzione della condizione di ipotesi nulla, che è alla base delle statistiche di verifica.

Pertanto, piccoli valori di p portano al rifiuto dell'ipotesi nulla. Ad esempio, se un valore p è compreso tra 0,05 e 0,01, l'ipotesi nulla viene deviata al livello del 5%, non dell'1%.

Si segnala che ad ogni verifica sono collegati vari suggerimenti e risultati di distribuzione. Ad esempio, alcune statistiche hanno distribuzioni di test precise e finite (di solito distribuzioni t o F). Altri sono grandi campioni di statistiche di test con distribuzioni χ2 asintotiche.


1.7.1. Diagnostica dei rapporti

La diagnostica dei rapporti fornisce informazioni e definisce i limiti dei rapporti valutati, incluso il caso speciale delle verifiche per le variabili mancanti e ridondanti. Verranno utilizzate le seguenti verifiche dei rapporti dell'equazione di regressione:

  • Le ellissi di confidenza consentono di rivelare la correlazione tra i rapporti delle equazioni;
  • Il test delle variabili mancanti consente di determinare la necessità di variabili aggiuntive nell'equazione di regressione;
  • Il test delle variabili ridondanti consente di rilevare le variabili in eccesso;
  • Il break test permette di determinare la reazione dell'equazione di regressione ai cambiamenti di un trend. È desiderabile creare una tale equazione di regressione che sia ugualmente efficace nel riflettere le quotazioni nei segmenti delle quotazioni ascendenti, discendenti e piatte.


1.7.2. Diagnostica dei residui

Abbiamo già accennato all'importanza di studiare i residui quando si cerca di trasformare le virgolette non stazionarie in quelle stazionarie.

Il test della radice unitaria può mostrare che i residui sono distribuiti molto più vicino alla legge normale rispetto alle virgolette di base. La parola "più vicino" riflette il fatto che i residui hanno la media e la dispersione dipendenti dal tempo, il che porta all'instabilità dei rapporti dell'equazione di regressione.

Usando i termini dei forum dei trader, possiamo dire che non dobbiamo "ottimizzare eccessivamente (ecco il nostro famigerato fitting!)" un sistema di trading, cioè non deve perdere le sue caratteristiche ai segmenti successivi. Il sistema non è adatto per segmenti di quotazioni future a causa dell'aspettativa matematica e della dispersione che cambiano nel tempo.

Per i residui verranno effettuati i seguenti test: correlazione serie, normalità, eteroschedasticità ed eteroschedasticità condizionale autoregressiva dei residui.

Correlogrammi - Statistica Q mostra le autocorrelazioni dei residui e calcola la statistica Q di Ljung-Box per i lag appropriati con l'indicazione del valore p.

Istogramma - il test di normalità mostra l'istogramma e le statistiche descrittive dei residui, comprese le statistiche di Jarque-Bera durante il test di normalità. Se i residui sono distribuiti normalmente, l'istogramma dovrebbe essere a forma di campana e le statistiche di Jarque-Bera non dovrebbero essere significative.

I test di eteroschedasticità verificano l'equazione dell'eteroschedasticità dei residui. Se c'è un'evidenza di eteroschedasticità, è necessario modificare la specifica di regressione (cambiare l'indicatore) o modellare l'eteroschedasticità.

Usiamo il test di eteroschedasticità di White con l'ipotesi nulla relativa all'assenza di eteroschedasticità contro il test di eteroschedasticità di una forma comune sconosciuta.

White descrive il suo metodo come il test comune per la specificazione dell'errore del modello, poiché l'ipotesi nulla su cui si basa il test suggerisce che gli errori sono sia omoschedastici che indipendenti dalle variabili indipendenti e che la specificazione del modello lineare è corretta. L'esclusione di uno qualsiasi di questi parametri potrebbe portare a statistiche di test significative. Al contrario, una statistica di test insignificante implica che nessuno di questi tre parametri sia stato violato.


1.7.3. Diagnostica di stabilità

La stabilità diagnostica è la più interessante e importante in questo caso, poiché i risultati della diagnostica rivelano le capacità predittive dell'indicatore. Su MT4 o MT5 la stabilità può essere diagnosticata utilizzando lo strategy tester. Più avanti mostreremo che lo strategy tester non può diagnosticare la stabilità futura di un sistema di trading creato utilizzando gli indicatori. Può solo dare una valutazione di un sistema di trading basato su dati storici.

Come durante i test dei sistemi di trading, il metodo comune della diagnostica di stabilità è che le barre di quotazione T sono divise nelle osservazioni Т1, che verranno utilizzate per la valutazione, e le barre Т2 = Т Т1, che verranno utilizzate per il test e la valutazione.

Nel caso in cui un sistema di trading venga testato su due segmenti, il problema della sua stabilità futura non può essere risolto, poiché il test sul secondo segmento mostra solo che questo nuovo segmento è simile al precedente per i suoi parametri statistici sconosciuti. Allo stesso tempo, i problemi statistici che sono stati risolti durante la creazione del sistema di trading rimangono sconosciuti.

Naturalmente, durante il test dei sistemi di trading vengono selezionati diversi segmenti di quotazione, ma è impossibile rilevare a occhio, ad esempio, aree di eteroschedasticità o segmenti di quotazione, in corrispondenza dei quali i rapporti di regressione saranno instabili.

Di seguito sono elencati diversi test (non tutti i test di stabilità). Con questi test possiamo essere sicuri che un sistema di trading mostrerà un risultato stabile, nel caso in cui le condizioni di test compaiano in una quotazione in futuro.

Ad esempio, il cambiamento di una direzione di tendenza da discendente a ascendente o viceversa è un test del punto di interruzione. Se questo test non ha trovato un punto di rottura, possiamo essere sicuri che l'indicatore mostrerà risultati stabili in caso di eventuali cambiamenti di tendenza.

Test del punto di rottura Quandt-Andrews

L'ipotesi nulla: l'assenza di breakpoint tra due osservazioni, distanziate dalle estremità del campione del 15%.

Il test dei breakpoint di Quandt-Andrews esegue la verifica di uno o più breakpoint di strutture incognite in un campione per una data equazione. L'idea di base del test di Quandt-Andrews è che viene eseguito un test separato del punto di interruzione di Chow per ogni osservazione tra due date o osservazioni t1 e t2. K di statistiche di test dai test di Chow vengono quindi sommati in una statistica di test per il test contro l'ipotesi nulla relativa all'assenza di breakpoint tra t1 e t2.

Test di RIPRISTINO di Ramsey

L'ipotesi nulla: l'errore nella gestione della regressione è un valore normalmente distribuito con media nulla.

La correlazione in serie, l'eteroschedasticità o la legge di distribuzione anormale per tutti violano l'assunto che i rumori siano distribuiti normalmente.

RESET - un test comune per i seguenti tipi di errori di specifica:

  • Variabili mancanti; X non include tutte le variabili appropriate;
  • Forma funzionale errata: alcune o tutte le variabili in y e X devono essere trasformate da un logaritmo, una potenza, un valore inverso o in altro modo;
  • La correlazione tra X ed e può essere causata da alcuni fattori tra cui l'errore di misurazione di X o la presenza di un valore di lag e una correlazione nella serie di rumore.

Con tali errori di specifica, le valutazioni OSL saranno spostate (l'errore di sistema non è uguale a zero) e non valide (non si adatta alla quantità valutata per la sua probabilità all'aumentare del numero di osservazioni), quindi le normali procedure di output saranno ingiustificate.

Residui ricorsivi

I test sui residui ricorsivi si basano sulle valutazioni di regressione multipla con l'aumento graduale del numero di barre.

Test di previsione un passo avanti

Se osserviamo la definizione dei residui ricorsivi presentati in precedenza, possiamo vedere che ogni residuo ricorsivo è un errore di previsione un passo avanti. Se si vuole verificare la possibilità che il valore della variabile dipendente passi dal modello adattato lungo tutti i dati fino al punto per il tempo t, ogni errore deve essere confrontato con la sua deviazione standard dall'intero campione.

Stime ricorsive del rapporto

Questo tipo consente di tracciare la variazione delle stime per qualsiasi rapporto quando la quantità di dati di stima in un campione aumenta. La figura mostra i rapporti selezionati nell'equazione per tutte le stime ricorsive eseguibili. Le figure mostrano due intervalli standard intorno ai rapporti stimati.

Nel caso in cui il rapporto mostri un cambiamento significativo quando si aggiungono i dati all'equazione di valutazione, questo è un sicuro segno di instabilità. Le immagini del rapporto a volte possono mostrare salti drammatici, poiché l'equazione postulata cerca di superare una rottura strutturale.

L'analisi tecnica ha una vasta gamma dei cosiddetti indicatori "adattativi", sebbene non ci siano tentativi di determinare l'effettiva necessità di tale adattamento. Le stime ricorsive dei rapporti possono risolvere questo problema.


2. Preparazione dei dati iniziali

Per la nostra analisi, prendiamo i prezzi ravvicinati delle quotazioni giornaliere dell'EUR/USD dall'11 novembre 2010 al 23 marzo 2011. Le quotazioni vengono ricevute dal terminale MT4 tramite F2 ed esportate in Excel.

Il grafico lineare delle quotazioni ha il seguente aspetto:

Fig.5. Grafico EURUSD

Fig.5. Grafico EURUSD

Questo esempio mostra la necessità di controllare i dati mancanti negli indicatori. Non dobbiamo pensare che le quotazioni mostrate siano solo un caso speciale di quotazioni di bassa qualità. L'omissione dei dati può verificarsi per vari motivi. Inoltre, dobbiamo tenere in considerazione i dati persi durante le vacanze negli Stati Uniti. Il problema dei dati mancanti diventa particolarmente critico quando si costruiscono sistemi di trading basati su vari fattori economici, come la correlazione dei tassi di cambio e degli indici azionari, che non vengono scambiati 24 ore su 24.

Nel nostro caso semplice è possibile eseguire l'interpolazione lineare e ridurre almeno in una certa misura l'influenza dei dati mancanti sui calcoli.

Inoltre c'è il problema degli outlier. Il problema degli outlier è più complicato del problema dei dati mancanti. Prima di iniziare a cercare gli outlier, dobbiamo rispondere alla seguente domanda: cos'è un outlier? Lo considero come un movimento di prezzo superiore a tre deviazioni standard che non è stato seguito da un ulteriore forte movimento di prezzo.

Gli outlier sono determinati non dalle quotazioni ma dai loro residui: calcoliamo la serie sottraendo il valore del prezzo precedente da quello successivo – eurusd(i) – eurusd(i+1) (nella notazione MQL). La notazione inglese ha diversi nomi per questo valore. È "differenziato" sul grafico. La parola "ritorno" è usata più spesso. Userò la parola "residuo" qui e sotto. È il valore ottenuto dopo la rimozione di un trend nelle quotazioni. Il grafico dei residui EURUSD ha il seguente aspetto:


Fig. 6. Residuo EURUSD

Fig.6. Residuo EURUSD

La deviazione standard per le quotazioni EURUSD è pari a 0,033209. Pertanto, non ci sono valori anomali nelle nostre quotazioni secondo il criteri di outlier formulati.

Nel caso in cui siano presenti valori anomali, possono essere sostituiti, ad esempio, con valori per i dati mancanti e quindi interpolati.

Il metodo fornito per rimuovere i valori anomali non è l'unico e, soprattutto, non è corretto. Se il residuo comprende i residui di quotazioni dopo la rimozione di un trend, è abbastanza evidente che la dimensione degli outlier dipende dal metodo con cui viene determinato il trend, cioè il problema degli outlier deve essere considerato dopo che è stato risolto il problema della determinazione del trend.

A questo punto la preparazione dei dati di base per l'ulteriore analisi si considera completata.


3. Analisi dei parametri statistici

L'analisi dei parametri statistici delle quotazioni Forex e l'analisi delle quotazioni EURUSD in particolare vengono effettuate per verificare la possibilità di applicare gli indicatori per l'analisi e la creazione di sistemi di trading.

L'algoritmo tipico di creazione di un sistema di trading è il seguente:

  1. Viene selezionato un indicatore (ad esempio, Moving Average) e sulla base di esso viene creato un sistema di trading;
  2. Poiché di solito è impossibile costruire un sistema di trading basato su un singolo indicatore, vengono implementati indicatori aggiuntivi per evitare false entrate nel mercato.

Inoltre, in questa fase va pronunciato il mantra "non esagerare, basta non esagerare".


3.1. Statistiche descrittive

Sappiamo dalle statistiche che se una quotazione fosse stata soggetta alla normale legge di distribuzione come un valore casuale, il valore dell'errore medio di calcolo sarebbe cambiato al variare del numero di periodi e avrebbe coinciso all'infinito con l'aspettativa matematica, una costante per la legge normale. Le quotazioni avrebbero potuto essere sostituite con una linea retta orizzontale, stop loss e take profit avrebbero potuto essere fissati ai livelli delle deviazioni standard. Ma non è così. Esaminiamo le ragioni.

Verificheremo la conformità delle quotazioni con la normale legge sulla distribuzione.

Creiamo l'istogramma delle quotazioni EURUSD che ha il seguente aspetto:

Fig.7. Istogramma EURUSD

Fig. 7. Istogramma EURUSD

L'istogramma mostra quante volte è emerso un prezzo definito all'interno della gamma che abbiamo selezionato.

Secondo il suo aspetto, la distribuzione non è normale, due cime rovinano l'intero quadro. Eseguiamo il test di normalità di Jarque-Bera con ipotesi H0 nulla: la distribuzione è normale. Il risultato è mostrato di seguito:

 Parametro Valore (fatto) Valore teorico
Media
1,3549
La media dovrebbe essere uguale alla mediana
Mediana
1,3580
La mediana dovrebbe essere uguale alla media
Deviazione Standard
0,0332
-
Asimmetria (inclinazione)
0,0909
0,0
Curtosi
2,1052
3,0
Jarque-Bera
3,5773
0,0
Probabilità
0,1671
1,0


Tabella 1. Risultato del test di normalità della distribuzione

Secondo il criterio di Jarque-Bera, la conclusione sul mancato rispetto della normalità non è così dogmatica perché:

  • La media e la mediana quasi coincidono
  • L'asimmetria è vicina allo zero
  • La curtosi è vicino a tre
  • Le discrepanze esistenti sono ben rispecchiate dall'ultima riga "Probabilità", che mostra che la distribuzione è normale con una probabilità del 16,7186%.

Potremmo avere atteggiamenti diversi nei confronti di questa figura. Da un lato, non possiamo rifiutare l'ipotesi nulla (una quotazione è distribuita normalmente) sul livello di significatività convenzionale, come il 95%. Al contrario, è impossibile considerare la distribuzione normale al 16%.

Poiché la media è quasi coincidente con la mediana (una delle caratteristiche della distribuzione normale), controlliamo se possiamo fidarci dei valori calcolati della media. Eseguiamo il test per l'uguaglianza media dividendo le virgolette in sezioni.

Il risultato è il seguente:

EURUSD
 QuantitàMedia
Deviazione Standard
 Errore medio
[1,25, 1,3)
4
1,2951
0,0034
0,0017
[1,3, 1,35)
42
1,3262
0,0125
0,0019
[1,35, 1,4)
48
1,3740
0,0133
0,0019
[1,4, 1,45)
9
1,4131
0,0083
0,0027
Tutto
103
1,3549
0,0332
0,0032


Tabella 2. Confronto dei valori medi ai segmenti

Come mostrato da questo test, la media viene calcolata con un errore avente il valore più tipico di 19 pip che può arrivare fino a 32 pip.

Considerando ciò, concludiamo che non possiamo usare la media.

Il valore della deviazione standard di 0,033209 sembra molto sospetto. Questi sono 332 pip! In generale, una deviazione standard così grande è ovvia: La quotazione EURUSD ha un trend, che di fatto è una componente deterministica regolare che distorce qualsiasi caratteristica statistica delle quotazioni.


3.2. Testare l'Autocorrelazione delle Quotazioni

Il concetto di "casualità" si basa sull'indipendenza di valori di quantità casuali l'uno rispetto all'altro. L'aspetto delle quotazioni consente di trovare le sezioni di movimento direzionali - tendenze.

Il determinismo (presenza di un trend) implica la dipendenza dei valori EURUSD adiacenti che possono essere verificati calcolando l'autocorrelazione (ACF), ovvero la correlazione tra i valori EURUSD adiacenti.

I risultati sono mostrati sotto:

Fig.8. Funzione di autocorrelazione delle quotazioni EURUSD

Fig.8. Funzione di autocorrelazione delle quotazioni EURUSD

La probabilità unita alla statistica Q è la stessa ovunque e uguale a zero.

I calcoli mostrano che:

  • Il valore della funzione di autocorrelazione diminuisce gradualmente e tale diminuzione è probabilmente regolare.

La probabilità calcolata si riferisce al test con l'ipotesi nulla, ma non c'è correlazione fino al lag 16 (nel nostro caso). Poiché questa probabilità è uguale a zero per tutti i lag, rifiutiamo categoricamente l'ipotesi nulla sull'assenza di autocorrelazione (tendenza) tra virgolette.


3.3. Analisi della Stazionarietà delle Quotazioni

Effettueremo l'analisi della stazionarietà delle quotazioni EURUSD utilizzando il test Dickey-Fuller nelle sue tre versioni: con uno spostamento, con un trend, senza uno spostamento e un trend.

Il risultato del test è composto da due parti: per EURUSD e per quotazioni EURUSD differenziate indicate come D(EURUSD).

L'ipotesi nulla di quel test è che EURUSD non è stazionario (ha una radice unitaria). Effettueremo i calcoli non solo di una radice unitaria, ma anche delle caratteristiche statistiche dei risultati della differenziazione EURUSD. La tabella di differenziazione è presentata di seguito:

Fig.9. Residuo quotazioni EURUSD

Fig.9. Residuo di quotazioni EURUSD

Si può concludere visivamente che le quotazioni differenziate EURUSD sono oscillazioni casuali situate approssimativamente intorno allo zero.

Esaminiamo tre metodi di calcolo del test di stazionarietà delle quotazioni EURUSD.

1. Le quotazioni senza uno spostamento (una costante) e una tendenza, per le quali la regressione ha il seguente aspetto:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1))

La probabilità di accettare l'ipotesi nulla (la serie non è stazionaria): 0,6961

 VariabileRapporto
Statistica tProbabilità di essere uguale a zero
 EURUSD(1)
3,09E-05
0,0488
0,9611
 D(EURUSD(1))
0,2747
2,8759
0,0049

Tabella 3. Risultati del test di stazionarietà senza considerare lo spostamento e la tendenza

Valutazione dell'adattamento di regressione a D(EURUSD) per R quadrato: 0,07702.

Da tali dati si possono trarre le seguenti conclusioni:

  1. Le quotazioni EURUSD dovrebbero essere riconosciute come non stazionarie con alta probabilità (69%). Non rifiutiamo rigorosamente l'ipotesi nulla;
  2. L'incremento D(EURUSD) non dipende dal precedente valore del prezzo EURUSD con la probabilità del 99,5%;
  3. D(EURUSD) dipende completamente dal precedente incremento D(EURUSD(1));
  4. Il valore del rapporto di determinazione R quadrato= 0,077028 mostra la completa non conformità della regressione con quotazioni differenziate D(EURUSD).

2. Quotazione EURUSD con uno spostamento (una costante), per la quale la regressione appare come segue:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1)) + С(3)
 VariabileRapporto
Statistica tProbabilità di essere uguale a zero 
 EURUSD(1)
-0,0445
-1,6787
0,0964
 D(EURUSD(1))
0,3049
 3,1647
0,0021
 С 0,0603 1,68030,0961


Tabella 4. Risultati del test di stazionarietà considerando lo spostamento

La probabilità di accettazione dell'ipotesi nulla (la serie non è stazionaria): 0,4389

Valutazione dell'adattamento di regressione a D(EURUSD) per R quadrato: 0,1028

Da tali dati si possono trarre le seguenti conclusioni:

  1. Le quotazioni EURUSD dovrebbero essere riconosciute come non stazionarie con probabilità piuttosto elevate (43%). Non rifiutiamo rigorosamente l'ipotesi nulla;
  2. Non dovremmo includere il precedente valore del prezzo EURUSD e una costante (uno spostamento) nell'equazione di regressione per l'incremento D(EURUSD), poiché consideriamo questi rapporti uguali a zero per il livello di significatività del 5%;
  3. D(EURUSD) dipende completamente dal precedente incremento D(EURUSD(1));
  4. Il valore del rapporto di determinazione R quadrato= 0,102876 mostra la completa non conformità della regressione con quotazioni differenziate D(EURUSD).

3. Quotazione EURUSD con uno spostamento (una costante) e una tendenza, per la quale la regressione appare come segue:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1)) + С(3) + С(4) * TREND

La probabilità di accettare l'ipotesi nulla (la serie non è stazionaria): 0,2541

 VariabileRapporto
Statistica t
Probabilità di essere uguale a zero 
EURUSD(-1)
-0,0743
-2,6631
0,0091
D(EURUSD(-1))
0,2717
2,8867
0,0048
C
0,0963
2,5891
0,0111
TREND(11/01/2010)
8,52E-05
2,7266
0,0076

Tabella 5. Risultati del test di stazionarietà considerando lo spostamento e la tendenza

Valutazione dell'adattamento di regressione a D(EURUSD) per R quadrato: 0,1667

Da tali dati si possono trarre le seguenti conclusioni:

  1. Le quotazioni EURUSD devono essere riconosciute come non stazionarie con probabilità piuttosto elevate (25%). Non rifiutiamo rigorosamente l'ipotesi nulla;
  2. Sebbene la probabilità che il rapporto sia uguale a zero durante un trend è inferiore all'1%, il valore di questo rapporto è estremamente piccolo, cioè il trend è una linea orizzontale;
  3. Il valore del rapporto di determinazione R quadrato= 0,166742 mostra la completa non conformità della regressione con quotazioni differenziate D(EURUSD).

Da questi calcoli si può trarre la seguente conclusione: nel caso in cui le quotazioni EURUSD di base non siano stazionarie, allora la loro prima differenza, ottenuta sottraendo il valore del prezzo precedente da quello successivo, è probabilmente stazionaria.

In questo caso abbiamo rimosso un trend e uno shift, che possono essere descritti dalla seguente equazione:

eurusd = c(1) * trend + c(2),

dove c(1) e c(2) sono costanti che possono essere valutate con il metodo dei minimi quadrati.

Questa equazione è un'equazione di regressione comune che coincide completamente con lo strumento di "regressione" nel terminale MT4. Cioè, abbiamo sostituito la quotazione di base con la linea retta. È un metodo ampiamente utilizzato nell'analisi tecnica, in quanto possiamo facilmente ricordare una vasta gamma di strumenti costituiti da linee rette: canali, livelli di supporto e resistenza, livelli di Fibonacci, Gann ecc.

Le linee rette sono il primo strumento utilizzato da qualsiasi trader. Ma perché ci fidiamo di questo strumento? Perché consideriamo affidabili le linee rette? Risponderemo a questa domanda più avanti nell'articolo.

Oltre alle rette, nell'analisi tecnica vengono utilizzati anche gli indicatori che sostituiscono le quotazioni di base con alcune curve. Faremo lo stesso e prenderemo due noti indicatori per l'analisi: la media mobile esponenziale e il filtro di Hodrick-Prescott.


4. Quotazioni Detrending

L'uso del termine «detrending» intende sottolineare il collegamento di questa sezione con la corrispondente nozione di econometria. Più precisamente e in coerenza con il modello dei mercati finanziari precedentemente dichiarato, si dovrebbe parlare di rimozione (detrending) di una componente regolare dalle quotazioni.

Abbiamo determinato tre componenti regolari nel nostro caso: trend lineare, media mobile esponenziale e filtro di Hodrick-Prescott.

Tutti i componenti regolari verranno impostati come serie temporali.


4.1. Tendenza lineare

Impostiamo il trend lineare aggiungendo uno al valore precedente.

Valuteremo i rapporti di regressione lineare:

eurusd = c(1) * trend + c(2),

Otteniamo il grafico combinato di una quotazione base eurusd, retta di regressione spostata verticalmente e il residuo ottenuto sottraendo la retta di regressione dalla quotazione:

Fig.10. Grafico EURUSD, regressione lineare e residuo

Fig.10. Grafico EURUSD, regressione lineare e residuo

Ora valutiamo la seguente equazione usando il metodo dei minimi quadrati:

EURUSD = С(1)*TREND + С(2)

La valutazione dell'equazione di regressione è accompagnata dai seguenti dati:

Variabile
Rapporto
 Statistica t Probabilità di essere uguale a zero
TREND
0,0004
4,4758
0,0000
C
1,3318
223,3028
0,0000

Tabella 6. Risultati del test di stazionarietà del trend lineare

Valutazione dell'adattamento di regressione alla quotazione R quadrato = 0,1655.

Dal risultato si possono trarre le seguenti conclusioni:

  1. Secondo il rapporto di determinazione R quadrato, la retta può spiegare le variazioni delle quotazioni solo nel 16% dei casi;
  2. Il residuo della detrazione dell'andamento lineare dalla quotazione differisce in modo irrilevante dalla quotazione stessa. Apparentemente, avrà gli stessi difetti statistici della citazione.


4.2. Livellamento esponenziale

Verranno selezionati l’algoritmo di Holt-Winters senza una componente stagionale con parametri di livellamento per una quotazione (livello) e un trend per il livellamento esponenziale.

L'idea principale del metodo:

  • Rimuovere il trend dalle serie temporali separando il livello dal trend;
  • Livellamento del livello (un parametro);
  • Livellamento della previsione di tendenza (parametro b).

Il risultato ottenuto è mostrato in figura.

Fig.11. Media mobile esponenziale

Fig.11. Media mobile esponenziale (EMA)

Abbiamo ricevuto una media mobile esponenziale standard che è leggermente in ritardo ma mostra la quotazione abbastanza bene. I parametri di livellamento sono visualizzati in alto, la selezione dei parametri non è stata effettuata.

Ora valutiamo la seguente equazione usando il metodo dei minimi quadrati:

EURUSD = С(1)*EURUSD_EX +С(2)

La valutazione dell'equazione di regressione è accompagnata dai seguenti dati:

Variabile
Rapporto
 Statistica tProbabilità di essere uguale a zero
EURUSD_EX
0,9168
24,3688
 0,0000
C
0,1145
2,2504
 0,0266


Tabella 7. Risultati della valutazione della regressione lineare

Valutazione dell'adattamento di regressione alla quota R quadrato = 0,8546

Dal risultato si possono trarre le seguenti conclusioni:

  1. Secondo il rapporto di determinazione R quadrato, la media mobile esponenziale può spiegare le variazioni delle quotazioni nell'84% dei casi;
  2. Il residuo della detrazione della media esponenziale dalla quotazione è simile a un processo casuale con distribuzione normale. Consideriamo che ci sia un senso nell'ulteriore analisi di quel residuo.


4.3. Filtro Hodrick-Prescott

Il filtro Hodrick-Prescott ha il parametro lambda.

Non ci occuperemo della selezione di questo parametro e lo considereremo uguale a 8162.

Il risultato è mostrato di seguito:

Fig.12. Filtro Hodrick-Prescott

Fig.12. Filtro Hodrick-Prescott

Ora valutiamo la seguente equazione usando il metodo dei minimi quadrati:

EURUSD = С(1)*EURUSD_HP + С(2)

La valutazione dell'equazione di regressione è accompagnata dai seguenti dati:

Variabile
Rapporto
Statistica t
 Probabilità di essere uguale a zero
EURUSD_HP
1,0577
23,9443
0,0000
C
-0,0782
-1,3070
0,1942


Tabella 8. Risultati della valutazione dell'adattamento della regressione alle quotazioni

Valutazione dell'adattamento di regressione alla quotazione R quadrato = 0,8502

Dal risultato si possono trarre le seguenti conclusioni:

  1. La probabilità che il secondo rapporto (la costante) sia uguale a zero è del 19%. Ciò mette in dubbio l'uso della costante nell'equazione di regressione;
  2. Secondo il rapporto di determinazione R quadrato, il filtro di Hodrick-Prescott può spiegare i cambiamenti nelle virgolette nell'85% dei casi;
  3. Il residuo della deduzione del filtro di Hodrick-Prescott dalla quotazione è simile a un processo casuale con la distribuzione normale e ha senso analizzarlo ulteriormente.


5. Diagnostica dei rapporti

La diagnostica dei rapporti include i seguenti test:

  1. L'ellisse di confidenza definisce la correlazione tra i rapporti dell'equazione di regressione: più l'ellisse è vicina a un cerchio, minore è la correlazione;
  2. L'intervallo di confidenza definisce i limiti della variazione dei rapporti di equazione. In analisi tecnica, i rapporti sono le costanti che di solito possono essere modificate utilizzando il parametro "periodo" o in qualche altro modo. Ma in ogni caso, i rapporti non sono considerati valori casuali. Controlliamo se ciò è vero;
  3. Test delle variabili mancate – viene considerata l'ipotesi nulla: una variabile indipendente aggiuntiva non è significativa.
  4. Test delle variabili ridondanti – l'ipotesi nulla: il rapporto delle variabili aggiuntive è uguale a zero;
  5. Il test dei punti di interruzione determina la presenza dei punti di variazione delle caratteristiche statistiche delle quotazioni. Controlliamo i punti di cambiamento di tendenza in termini di analisi tecnica nel ruolo dei punti di cambiamento menzionati. Nella quotazione EURUSD analizzata possiamo allocare almeno due tendenze: discendente e ascendente (qui ignoriamo un movimento piatto).

5.1. Ellisse di fiducia

Creiamo ellissi di confidenza per ciascuna delle equazioni di regressione:

Fig.13. Ellisse di confidenza per l'equazione di regressione 1

Fig.13. Ellisse di confidenza per l'equazione di regressione 1

Fig.14. Ellisse di confidenza per l'equazione di regressione 2

Fig.14. Ellisse di confidenza per l'equazione di regressione 2

Fig.15. Ellisse di confidenza per l'equazione di regressione 3

Fig.15. Ellisse di confidenza per l'equazione di regressione 3


Dalle cifre si possono trarre le seguenti conclusioni:

  1. La correlazione dei rapporti per la regressione del trend lineare è presente e può essere valutata approssimativamente a 0,5;
  2. La correlazione per la regressione con la media mobile esponenziale e il filtro di Hodrick-Prescott è praticamente uguale a uno, il che richiede l'esclusione delle costanti delle equazioni di regressione. La probabilità significativa che la costante sia uguale a zero supporta l'idea della sua esclusione dall'equazione di regressione con filtro di Hodrick-Prescott.


5.2. Intervallo di confidenza

Verifichiamo l'ipotesi che le costanti nell'equazione di regressione siano valori casuali.

Per fare ciò dovremmo creare intervalli di confidenza:

 Variabile  Rapporto Intervallo di confidenza 90% Intervallo di confidenza 95%
Bordo inferiore
Bordo superiore
% dall'intervallo
Bordo inferiore Bordo superiore % dall'intervallo
TREND
0,0004
0,0002
0,0006
74,3362
0,0002
0,0006
88,7168
C
1,3318
1,3219
1,3417
1,4868
1,3200
1,3436
1,7767
        
EURUSD_EX
0,9168
0,8543
0,9793
13,6247
0,8422
0,9914
16,2810
C
0,1145
0,0300
0,1991
147,5336
0,0135
0,2155
176,2960
        
EURUSD_HP
1,0577
0,9844
1,1310
13,8661
0,9701
1,1453
16,5694
C
-0,0782
-0,1776
0,0211
254,0276
-0,1970
0,0405
303,5529


Tabella 9. Livelli di confidenza dei rapporti di regressione

Osservando gli intervalli di confidenza, possiamo vedere che il rapporto è un valore casuale che si comporta in base al suo stato: mentre la confidenza aumenta (la larghezza del canale si riduce), la larghezza dell'intervallo si espande.

La colonna «% dall'intervallo» è di grande interesse, in quanto rappresenta la relazione percentuale tra la larghezza dell'intervallo del valore del rapporto e il valore del rapporto. Come possiamo vedere, questa quantità per le costanti di regressione con la media esponenziale e il filtro ha valori del tutto inaccettabili superiori al 100%! Occorre ricordare ancora che i rapporti di correlazione tra due rapporti di queste equazioni sono quasi uguali a uno.

Rimuoviamo la costante dalle equazioni e valutiamo nuovamente i rapporti di regressione.

Si otterrà il seguente risultato:

 Variabile  Rapporto Intervallo di confidenza 90% Intervallo di confidenza 95%
Bordo inferiore Bordo superiore % dall'intervallo Bordo inferiore Bordo superiore % dall'intervallo
EURUSD_EX1,0014
0,9999
1,0030
0,3131
0,9996
1,0033
0,3742
EURUSD_HP
1,0000
0,9984
1,0015
0,3127
0,9981
1,0018
0,3737

Tabella 10. Intervalli di confidenza dei rapporti di regressione ricalcolati

Non visualizzerò i nuovi calcoli per le regressioni con la media esponenziale e il filtro per non rendere l'articolo troppo grande.

Dirò solo che le seguenti equazioni di regressione verranno utilizzate più avanti:

EURUSD = 1.00149684612*EURUSD_EX

EURUSD = 1.00002609628*EURUSD_HP


5.3. Variabili mancanti ed eccessive (indicatori)

Un tipico algoritmo di creazione di un sistema di trading consiste nei seguenti passaggi. Alcuni indicatori vengono presi e utilizzati per testare un sistema di trading. Quindi viene aggiunto un indicatore aggiuntivo per risolvere i falsi trigger del sistema di trading, ecc.

Questo algoritmo non può mostrare quando un trader deve fermarsi. Non è in grado di indicare se sono necessari alcuni indicatori aggiuntivi o se è necessario escludere alcuni indicatori dal sistema di negoziazione. La teoria esistente sulla creazione di sistemi di trading non può rispondere a queste domande, ma le risposte possono essere trovate quando si esegue il test per le variabili mancanti ed eccessive (indicatori).

Test delle variabili mancate – viene considerata l'ipotesi nulla: una variabile indipendente aggiuntiva non è significativa.

Creiamo un indicatore complesso tra i tre che abbiamo:

EURUSD = C(1)*TREND + C(2) + C(3)*EURUSD_EX + C(4)*EURUSD_HP

Valutando i rapporti di questo indicatore integrale (regressione), otterremo il seguente risultato:

EURUSD = 1,41879198369e-05*TREND - 0,00319950161771 + 0,50111527265*EURUSD_EX + 0,501486719095*EURUSD_HP

La probabilità che i rapporti appropriati siano uguali a zero sono mostrate nella seguente tabella:

 Variabile RapportoProbabilità di essere uguale a zero
TREND
 1,42E-05
 0,7577
C
 -0,0032
 0,9608
EURUSD_EX
 0,5011
 0,0000
EURUSD_HP 0,5014 0,0004


Tabella 11. Valutazione della probabilità che i rapporti degli indicatori siano uguali a zero

La tabella mostra che non avremmo dovuto includere l'indicatore TREND e la costante, poiché possiamo essere sicuri che i loro rapporti sono uguali a zero.

Aggiungiamo un altro indicatore integrale (il quadrato della media esponenziale eurusd_ex^2) al precedente ed effettuiamo il test della variabile mancata (eurusd_ex^2) con l'ipotesi nulla: la variabile aggiuntiva eurusd_ex^2 non è significativa.

Secondo le statistiche t e F calcolate, la probabilità che la variabile aggiuntiva (eurusd_ex^2) non sia significativa è pari al 44,87%. Su questa base, si può affermare che non sono necessari indicatori aggiuntivi nel nostro sistema di trading.

Ma, cosa ancora più interessante, è la stima dell'indicatore complessivo con l'aggiunta di eurusd_ex^2 mostrata nella tabella:

Variabile
 RapportoProbabilità di essere uguale a zero
TREND
1,69E-05
0,7154
C
1,9682
0,4496
EURUSD_EX
-2,3705
0,5317
EURUSD_HP
0,4641
0,0020
EURUSD_EX^2
1,0724
0,4487

Tabella 12. Valutazione della probabilità che i rapporti degli indicatori complessivi siano uguali a zero con eurusd_ex^2

La tabella mostra che solo l'indicatore basato sul filtro Hodrick-Prescott è di un certo interesse.

Test delle variabili ridondanti - l'ipotesi nulla: il rapporto delle variabili aggiuntive è uguale a zero.

Proviamo ad esaminarlo dall'altra parte ed effettuiamo il test delle variabili ridondanti con l'ipotesi nulla: il rapporto delle variabili ridondanti è uguale a zero. Indicheremo la tendenza c come variabili ridondanti nel nostro indicatore complesso.

Secondo le statistiche t e F calcolate, la probabilità che le variabili trend e c ridondanti siano uguali a zero è del 92,95%. Su questa base, si può sostenere che il nostro sistema di trading ha variabili di tendenza e c ridondanti. Ciò corrisponde abbastanza bene ai risultati precedenti.

La valutazione dell'indicatore complessivo costituito dalla media esponenziale e dal filtro di Hodrick-Prescott ha il seguente aspetto:

Variabile
Rapporto
Probabilità di essere uguale a zero
EURUSD_EX
0,4992
0,00
EURUSD_HP
0,5015
0,00


Tabella 13.
Valutazione della probabilità che i rapporti degli indicatori complessivi siano uguali a zero, nel caso in cui questo indicatore sia costituito dalla media mobile esponenziale e dal filtro di Hodrick-Prescott

Ovvero non abbiamo dubbi sull'utilità di utilizzare questi indicatori nel sistema di negoziazione.


6. Diagnostica dei residui

6.1. Autocorrelazione - Statistica Q

Fig.16. Funzione di autocorrelazione dopo la deduzione del trend lineare

Fig.16. Funzione di autocorrelazione dopo la deduzione del trend lineare

Il correlogramma mostra che la detrazione del trend lineare dalla quotazione base non nega la presenza di un trend, come mostrato da ACF. La probabilità dell'assenza di correlazione è uguale a zero, cioè rifiutiamo rigorosamente l'ipotesi nulla a tutti i livelli di significatività.

Fig.17. Funzione di autocorrelazione dopo la deduzione del livellamento esponenziale

Fig.17. Funzione di autocorrelazione dopo la deduzione del livellamento esponenziale

Il correlogramma mostra che la detrazione della curva esponenziale dalla quotazione di base ha escluso il trend a tutte le candele superiori alla seconda, come mostrato da ACF.

Secondo i calcoli, la probabilità dell'assenza di correlazione è uguale a zero, cioè rifiutiamo rigorosamente l'ipotesi nulla a tutti i livelli di significatività.

Ma se facciamo degli sforzi aggiuntivi ed escludiamo la correlazione alle prime due candele, allora saremo in grado di ottenere il residuo senza correlazioni.

Fig.18. Funzione di autocorrelazione dopo la deduzione del filtro di Hodrick-Prescott

Fig.18. Funzione di autocorrelazione dopo la deduzione del filtro di Hodrick-Prescott

Il correlogramma mostra che la detrazione del filtro Hodrick-Prescott dalla quotazione di base ha escluso il trend a tutti le candele superiori al terzo, come mostrato da ACF. La probabilità dell'assenza di correlazione è uguale a zero, cioè rifiutiamo rigorosamente l'ipotesi nulla a tutti i livelli di significatività. Ma se facciamo degli sforzi aggiuntivi ed escludiamo la correlazione alle prime due candele, allora saremo in grado di ottenere il residuo senza correlazioni.

Conclusione. Il tentativo di rimuovere la componente deterministica deducendo i nostri indicatori dalla quotazione base EURUSD è completamente fallito per il trend lineare ed è parzialmente riuscito per la media mobile esponenziale e il filtro Hodrick-Prescott.

L'ulteriore analisi dei nostri indicatori diventa priva di significato a causa dell'autocorrelazione (componente deterministica). Dovremmo trovare un indicatore tale da permettere di escludere l'autocorrelazione nei residui. Lo faremo nella prossima sezione.


7. Creazione ed esame dell'indicatore considerando l'analisi

Al momento non disponiamo di una teoria formale per creare un insieme di indicatori. L'unico modo è la ricerca diretta con la selezione di alcuni set in base ai risultati dell'analisi.

Dalla precedente analisi di autocorrelazione si è concluso che l'autocorrelazione alle prime quotazioni delle candele è rimasta dopo il detrending.

Esaminiamo la seguente equazione considerando il fatto menzionato:

EURUSD = C(1)*EURUSD_HP(1) + C(2)*D(EURUSD_HP(1)) + C(3)*D(EURUSD_HP(2))

D(EURUSD_HP(1)) indica il residuo tra la quotazione e il livellamento del filtro Hodrick-Prescott, il primo lag (la seconda barra, non la prima quando si calcolano le barre a partire da una).

La valutazione di tali rapporti di equazione con l'uso del metodo dei minimi quadrati porta ai seguenti risultati:

 VariabileRapporto
Probabilità di essere uguale a zero
EURUSD_HP(1)
1,0001
0,0000
D(EURUSD(1))
0,8262
0,0000
D(EURUSD(-2))
-0,48810,0000


Tabella 14. Risultati della valutazione dei rapporti utilizzando il metodo dei minimi quadrati

Secondo il test delle variabili eccessive e le statistiche t e F calcolate, la probabilità che i rapporti in presenza delle variabili eurusd(1) e eurusd(2) siano uguali a zero è nulla, cioè queste due variabili non sono eccessive.

L'autocorrelazione mostra l'assenza di dipendenze fino al lag 16 con probabilità superiore al 70% (prima riga di firma):


Fig.19. Autocorrelazione dei residui

Fig.19. Autocorrelazione residua

Il test di eteroschedasticità bianco fornisce il risultato relativo alla statistica F che conferma che l'eteroschedasticità è assente con una probabilità dell'80%.

L'esame del breakpoint secondo il test di Quandt-Andrews con l'ipotesi nulla: «nessun breakpoint» dà come risultato che l'ipotesi nulla con la probabilità del 71% è accettata (nessun breakpoint).

Va ricordato ancora una volta che le quotazioni esaminate hanno almeno un breakpoint (un'inversione di tendenza) secondo l'analisi tecnica standard. Ma il nostro indicatore ha parametri statistici simili sia per le tendenze discendenti che per quelle ascendenti e, quindi, è invariante rispetto allo stato del mercato.

Test integrale di Ramsey con l'ipotesi nulla: «l'errore nella gestione della regressione è un valore normalmente distribuito» con probabilità del 48% per t e la statistica F è accettata. Su questa base, possiamo trascurare l'autocorrelazione del residuo e la sua eteroschedasticità.

Inoltre, ciò significa che le valutazioni dei quadrati lineari non vengono spostate (l'aspettativa matematica del valore esaminato coincide con il valore esaminato) ed è possibile eseguire il test ricorsivo dei residui.

Testiamo la previsione ricorsiva dei residui un passo avanti. La parte superiore della figura fornisce i residui ricorsivi e le linee di limitazione a due deviazioni standard. Inoltre, l'asse di sinistra mostra la probabilità per le candele di quotazioni, in corrispondenza delle quali l'ipotesi di costanza del rapporto dell'indicatore verrebbe deviata al livello di significatività del 5%, 10% e 15%. Non ci sono molti di questi punti, ma la loro esistenza significa false attivazioni di stop loss e take profit.

Fig.20. Test di previsione dei residui ricorsivi

Fig.20. Test ricorsivo di previsione dei residui

Chiamiamo stime ricorsive dei rapporti delle equazioni di regressione. Il grafico è formato come segue: vengono calcolati i valori dei rapporti per la barra all'estrema sinistra. Quindi viene aggiunta una barra e i valori dei rapporti vengono calcolati ripetutamente fino all'ultima barra. In caso di una piccola quantità di barre sul lato sinistro, i valori dei rapporti sono ovviamente molto instabili. Tuttavia, mentre aumenta il numero di barre utilizzate per il calcolo, si rafforza anche la stabilità (costanza).

Fig.21. Stime ricorsive del rapporto С(1)

Fig.21. Stime ricorsive del rapporto С(1)

Fig.22. Stime ricorsive del rapporto С(2)

Fig.22. (2) stime ricorsive del rapporto

Fig.23. Stime ricorsive del rapporto С(3)

Fig.23. С(3) stime ricorsive del rapporto

Le cifre mostrano che una certa instabilità è stata osservata all'inizio dell'intervallo delle quotazioni, ma poi si può considerare che i valori dei rapporti sono diventati stabili. Tuttavia, a rigor di termini, i rapporti della nostra equazione di regressione non sono costanti.


Conclusione


Questo articolo ha presentato un'ulteriore prova del fatto che i dati finanziari non sono stazionari. Il metodo standard di divisione dei dati non stazionari nella somma dei dati è stato utilizzato nell'articolo per ottenere un residuo stazionario.

Avendo un residuo stazionario delle virgolette di base, possiamo rispondere alla domanda principale relativa alla stabilità dell'indicatore ottenuto.

Le informazioni presentate nell'articolo sono solo l'inizio di una creazione di un sistema di trading che può e deve basarsi sulle previsioni delle quotazioni.


Lista delle fonti

EViews 7. User’s Guide II.


Tradotto dal russo da MetaQuotes Ltd.
Articolo originale: https://www.mql5.com/ru/articles/320

Utilizzo dell'analisi discriminante per sviluppare sistemi di trading Utilizzo dell'analisi discriminante per sviluppare sistemi di trading
Quando si sviluppa un sistema di trading, di solito si pone il problema di selezionare la migliore combinazione di indicatori e dei loro segnali. L'analisi discriminante è uno dei metodi per trovare tali combinazioni. L'articolo fornisce un esempio di sviluppo di un EA per la raccolta dei dati di mercato e illustra l'uso dell'analisi discriminante per la costruzione di modelli prognostici per il mercato FOREX nel software Statistica.
Previsione di serie temporali mediante livellamento esponenziale Previsione di serie temporali mediante livellamento esponenziale
L'articolo permette al lettore di familiarizzare con i modelli di livellamento esponenziale utilizzati per la previsione a breve termine delle serie temporali. Inoltre, tocca le questioni relative all'ottimizzazione e alla stima dei risultati di previsione e fornisce alcuni esempi di script e indicatori. Questo articolo sarà utile come prima conoscenza dei principi di previsione sulla base di modelli di livellamento esponenziale.
Previsione delle serie temporali mediante livellamento esponenziale (parte 2) Previsione delle serie temporali mediante livellamento esponenziale (parte 2)
Questo articolo cerca di aggiornare l'indicatore creato in precedenza e tratta brevemente un metodo per stimare gli intervalli di confidenza delle previsioni utilizzando il bootstrap e i quantili. Di conseguenza, otterremo l'indicatore di previsione e gli script da utilizzare per la stima dell'accuratezza della previsione.
Analisi delle principali caratteristiche delle serie temporali Analisi delle principali caratteristiche delle serie temporali
Questo articolo introduce una classe progettata per fornire una rapida stima preliminare delle caratteristiche di varie serie temporali. Mentre ciò avviene, vengono stimati i parametri statistici e la funzione di autocorrelazione, viene eseguita una stima spettrale delle serie temporali e viene costruito un istogramma.