Ti stai perdendo delle opportunità di trading:
- App di trading gratuite
- Oltre 8.000 segnali per il copy trading
- Notizie economiche per esplorare i mercati finanziari
Registrazione
Accedi
Accetti la politica del sito e le condizioni d’uso
Se non hai un account, registrati
Ho preparato un campionamento di 11 colonne + 1 colonna di output. Domanda: quando si avvia il Predictor quale numero di colonne deve essere specificato. Solo la quantità di dati (11) o insieme all'uscita (12) ????
Cioè, se nel foglio di calcolo iniziale (file csv) il numero di colonne N > 46, e il numero di righe M, allora il costo del tempo di calcolo è proporzionale a: 2 * (N - 2) + M - 2
Se il numero di colonne nel foglio di calcolo N < 13, il tempo impiegato nei calcoli è proporzionale a 2 * (N - 2)2 + M - 2
Cioè, se il numero di colonne nel foglio di calcolo è N = 12 (10 input), allora il tempo di calcolo sullo stesso computer sarà lo stesso che per N = 1025 (1023 input). Perché per il numero di ingressi inferiore a 11 si attivano le trasformazioni del kernel MSUA.
Ok, abbiamo sistemato i tempi. Ma ecco un'altra cosa che ho notato. Se si ottimizza uno stesso file, si ottengono risultati completamente diversi... Come completamente.... Essi differiscono, naturalmente, a volte anche molto. Cosa c'entra questo con Yuri? Ho pensato che durante l'ottimizzazione in questo caso dobbiamo arrivare allo stesso risultato. Ma qui si scopre che il risultato è diverso.... :-( Con cosa ha a che fare?
Ha a che fare con la casualità. Il campione generale è diviso in due sottocampioni, un campione di allenamento e un campione di controllo utilizzando jPrediction. jPrediction fa 100 tentativi di dividere il campione generale in due parti.
Ad ogni tentativo, viene costruito un modello sul sottocampione di allenamento. Sul campione di controllo, il modello è controllato "per lousiness". I risultati ottenuti sul controllo (generalizzabilità) sono visualizzati. Ma i risultati della capacità di formazione non sono necessari nell'inferno, perché sono un adattamento e quindi non vengono visualizzati da nessuna parte.
Se i migliori risultati di generalizzabilità sono molto diversi sullo stesso campione con corse diverse, significa che il campione non è rappresentativo - troppa spazzatura sugli input. Cioè, i predittori hanno una bassa significatività.
Se il campione è rappresentativo, lo stesso modello migliore può essere costruito più di una volta in 100 corse, cioè non dipende molto da quali esempi sono inclusi nel campione di allenamento e quali nel campione di controllo.
Quando si prevede una serie temporale NS, un partizionamento del campione utilizzando un PRNG non è di alcuna utilità pratica - una completa assurdità che non mostra nulla.
Solo il partizionamento artificiale con un campione di controllo alla fine della serie temporale